中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种优化初始中心点的K平均文本聚类算法

文献类型:期刊论文

作者赵万磊 ; 王永吉 ; 张学杰 ; 李娟
刊名计算机应用
出版日期2005
卷号25期号:9页码:2037-2040
关键词优化 文本聚类 K平均 optimize document clustering K-means
ISSN号1001-9081
其他题名variant of k-means algorithm for document clustering: optimization initial centers
中文摘要文本聚类在信息过滤,网页分类中有着很好的应用。但它面临数据量大,特征维度高的难点。由于K平均算法易于实现,对数据依赖度底,在文本聚类中得到应用。然而,传统K平均以及它的变种会产生有较大波动的聚类结果。因此对K平均算法进行了改进,通过优化聚类初始中心的选择,得到一种适合对文本数据聚类分析的改进算法。大量实验显示,该算法可以生成质量较高而且聚类质量波动性较小的结果。
收录类别wanfang,cnki,cscd
语种中文
公开日期2010-08-17
附注Document clustering had been employed in information filtering, web page classification and so on. K-means is one of the widely used clustering techniques because of its simplicity and high scalability. Owing to its random selection of initial centers, unstable results were often got when using traditional K-means and its variants. Here a technique of optimization initial centers of clustering was proposed. Combined with incremental iteration, it can produce clustering results with high purity, low entropy as well as good stableness.
源URL[http://124.16.136.157/handle/311060/3282]  
专题软件研究所_互联网软件技术实验室 _期刊论文
推荐引用方式
GB/T 7714
赵万磊,王永吉,张学杰,等. 一种优化初始中心点的K平均文本聚类算法[J]. 计算机应用,2005,25(9):2037-2040.
APA 赵万磊,王永吉,张学杰,&李娟.(2005).一种优化初始中心点的K平均文本聚类算法.计算机应用,25(9),2037-2040.
MLA 赵万磊,et al."一种优化初始中心点的K平均文本聚类算法".计算机应用 25.9(2005):2037-2040.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。