基于词类和搭配的微博舆情文本聚类方法研究
文献类型:期刊论文
作者 | 王恒静1; 曹存根2; 高尚1 |
刊名 | 南京师大学报:自然科学版
![]() |
出版日期 | 2015 |
卷号 | 38.0期号:1.0页码:57 |
关键词 | 微博舆情分析 词义类簇 搭配 相似度 文本聚类 |
ISSN号 | 1001-4616 |
英文摘要 | 微博是近年出现的新型互联网信息交流平台,它具有主题分散、体量短小、文体自由等特性,它能对社会产生巨大的影响,所以信息监管部门和商业企业对基于微博信息的舆情分析都有迫切需求.提出了基于搭配的文本聚类新方法,该方法先进行微博文本预处理,然后利用词类模型进行自动抽取有效搭配,最后基于有效搭配的模型进行文本聚类.实验证明利用词类文本聚类方法比传统文本聚类方法性能提高6.3%,而本文方法比利用词类文本聚类方法性能提升了16.8%,结果显示了本方法的有效性. |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/36201] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.江苏科技大学 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 王恒静,曹存根,高尚. 基于词类和搭配的微博舆情文本聚类方法研究[J]. 南京师大学报:自然科学版,2015,38.0(1.0):57. |
APA | 王恒静,曹存根,&高尚.(2015).基于词类和搭配的微博舆情文本聚类方法研究.南京师大学报:自然科学版,38.0(1.0),57. |
MLA | 王恒静,et al."基于词类和搭配的微博舆情文本聚类方法研究".南京师大学报:自然科学版 38.0.1.0(2015):57. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。