基于句子相关度的文本自动分类
文献类型:期刊论文
刊名 | 中国科学技术大学学报
![]() |
出版日期 | 2006 |
卷号 | 036 |
关键词 | 文本分类 语料库 相关度矩阵 句权 |
ISSN号 | 0253-2778 |
其他题名 | Text classification based on sentence correlation |
英文摘要 | 提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段待分类文本特别是中文文本的分词,模糊了词的多义问题,且在文本分类的实验中能够达到86%以上的查全率和查准率;随着语料库的不断训练和调整,分类性能还可以进一步提高,具有简单实现的特点. |
语种 | 中文 |
CSCD记录号 | CSCD:2541183 |
源URL | [http://ir.hfcas.ac.cn:8080/handle/334002/69073] ![]() |
专题 | 中国科学院合肥物质科学研究院 |
推荐引用方式 GB/T 7714 | . 基于句子相关度的文本自动分类[J]. 中国科学技术大学学报,2006,036. |
APA | (2006).基于句子相关度的文本自动分类.中国科学技术大学学报,036. |
MLA | "基于句子相关度的文本自动分类".中国科学技术大学学报 036(2006). |
入库方式: OAI收割
来源:合肥物质科学研究院
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。