中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于句子相关度的文本自动分类

文献类型:期刊论文

刊名中国科学技术大学学报
出版日期2006
卷号036
关键词文本分类 语料库 相关度矩阵 句权
ISSN号0253-2778
其他题名Text classification based on sentence correlation
英文摘要提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段待分类文本特别是中文文本的分词,模糊了词的多义问题,且在文本分类的实验中能够达到86%以上的查全率和查准率;随着语料库的不断训练和调整,分类性能还可以进一步提高,具有简单实现的特点.
语种中文
CSCD记录号CSCD:2541183
源URL[http://ir.hfcas.ac.cn:8080/handle/334002/69073]  
专题中国科学院合肥物质科学研究院
推荐引用方式
GB/T 7714
. 基于句子相关度的文本自动分类[J]. 中国科学技术大学学报,2006,036.
APA (2006).基于句子相关度的文本自动分类.中国科学技术大学学报,036.
MLA "基于句子相关度的文本自动分类".中国科学技术大学学报 036(2006).

入库方式: OAI收割

来源:合肥物质科学研究院

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。