中国科学院机构知识库网格系统: 基于监督学习的中文情感分类技术比较研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于监督学习的中文情感分类技术比较研究

文献类型：期刊论文


作者	唐慧丰; 谭松波; 程学旗
刊名	中文信息学报
出版日期	2007
卷号	21.0 期号:006 页码:88
关键词	计算机应用中文信息处理情感分类文本分类语言模型中文信息处理
ISSN号	1003-0077
英文摘要	情感分类是一项具有较大实用价值的分类技术，它可以在一定程度上解决网络评论信息杂乱的现象，方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少，其中各种有监督学习方法的分类效果以及文本特征表示方法和特征选择机制等因素对分类性能的影响更是亟待研究的问题。本文以n-gram以及名词、动词、形容词、副词作为不同的文本表示特征，以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法，以中心向量法、KNN、Winnow、Naive Bayes和SVM作为不同的文本分类方法，在不同的特征数量和不同规模的训练集情况下，分别进行了中文情感分类实验，并对实验结果进行了比较，对比结果表明：采用BiGrams特征表示方法、信息增益特征选择方法和SVM分类方法，在足够大训练集和选择适当数量特征的情况下，情感分类能取得较好的效果。
语种	英语
源URL	[http://119.78.100.204/handle/2XEOYT63/37203]
专题	中国科学院计算技术研究所期刊论文_中文
作者单位	中国科学院计算技术研究所
推荐引用方式 GB/T 7714	唐慧丰,谭松波,程学旗. 基于监督学习的中文情感分类技术比较研究[J]. 中文信息学报,2007,21.0(006):88.
APA	唐慧丰,谭松波,&程学旗.(2007).基于监督学习的中文情感分类技术比较研究.中文信息学报,21.0(006),88.
MLA	唐慧丰,et al."基于监督学习的中文情感分类技术比较研究".中文信息学报 21.0.006(2007):88.

入库方式： OAI收割

来源：计算技术研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。