中国科学院机构知识库网格系统: 重复串特征提取算法及其在文本聚类中的应用

文献类型：期刊论文


作者	胡吉祥; 许洪波; 刘悦; 程学旗
刊名	计算机工程
出版日期	2007
卷号	33.0 期号:002 页码:65
关键词	文本聚类特征提取重复串
ISSN号	1000-3428
英文摘要	针对Web文档的高维问题及网络新语言给现有分词系统带来的挑战，该文提出一种基于重复串的特征提取方法，可以从文本中提取有意义的特征，且对于中文无需分词。实验表明。该方法可以降低特征空间维度，同时能有效改善传统以词为特征的聚类算法的性能。
语种	英语
源URL	[http://119.78.100.204/handle/2XEOYT63/37659]
专题	中国科学院计算技术研究所期刊论文_中文
作者单位	中国科学院计算技术研究所
推荐引用方式 GB/T 7714	胡吉祥,许洪波,刘悦,等. 重复串特征提取算法及其在文本聚类中的应用[J]. 计算机工程,2007,33.0(002):65.
APA	胡吉祥,许洪波,刘悦,&程学旗.(2007).重复串特征提取算法及其在文本聚类中的应用.计算机工程,33.0(002),65.
MLA	胡吉祥,et al."重复串特征提取算法及其在文本聚类中的应用".计算机工程 33.0.002(2007):65.

入库方式： OAI收割

下载0