基于监督学习的中文情感分类技术比较研究
文献类型:期刊论文
作者 | 唐慧丰; 谭松波; 程学旗 |
刊名 | 中文信息学报
![]() |
出版日期 | 2007 |
卷号 | 21.0期号:006页码:88 |
关键词 | 计算机应用 中文信息处理 情感分类 文本分类 语言模型 中文信息处理 |
ISSN号 | 1003-0077 |
英文摘要 | 情感分类是一项具有较大实用价值的分类技术,它可以在一定程度上解决网络评论信息杂乱的现象,方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少,其中各种有监督学习方法的分类效果以及文本特征表示方法和特征选择机制等因素对分类性能的影响更是亟待研究的问题。本文以n-gram以及名词、动词、形容词、副词作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,以中心向量法、KNN、Winnow、Naive Bayes和SVM作为不同的文本分类方法,在不同的特征数量和不同规模的训练集情况下,分别进行了中文情感分类实验,并对实验结果进行了比较,对比结果表明:采用BiGrams特征表示方法、信息增益特征选择方法和SVM分类方法,在足够大训练集和选择适当数量特征的情况下,情感分类能取得较好的效果。 |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/37203] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 唐慧丰,谭松波,程学旗. 基于监督学习的中文情感分类技术比较研究[J]. 中文信息学报,2007,21.0(006):88. |
APA | 唐慧丰,谭松波,&程学旗.(2007).基于监督学习的中文情感分类技术比较研究.中文信息学报,21.0(006),88. |
MLA | 唐慧丰,et al."基于监督学习的中文情感分类技术比较研究".中文信息学报 21.0.006(2007):88. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。