一种优化初始中心点的K平均文本聚类算法
文献类型:期刊论文
作者 | 赵万磊 ; 王永吉 ; 张学杰 ; 李娟 |
刊名 | 计算机应用
![]() |
出版日期 | 2005 |
卷号 | 25期号:9页码:2037-2040 |
关键词 | 优化 文本聚类 K平均 optimize document clustering K-means |
ISSN号 | 1001-9081 |
其他题名 | variant of k-means algorithm for document clustering: optimization initial centers |
中文摘要 | 文本聚类在信息过滤,网页分类中有着很好的应用。但它面临数据量大,特征维度高的难点。由于K平均算法易于实现,对数据依赖度底,在文本聚类中得到应用。然而,传统K平均以及它的变种会产生有较大波动的聚类结果。因此对K平均算法进行了改进,通过优化聚类初始中心的选择,得到一种适合对文本数据聚类分析的改进算法。大量实验显示,该算法可以生成质量较高而且聚类质量波动性较小的结果。 |
收录类别 | wanfang,cnki,cscd |
语种 | 中文 |
公开日期 | 2010-08-17 |
附注 | Document clustering had been employed in information filtering, web page classification and so on. K-means is one of the widely used clustering techniques because of its simplicity and high scalability. Owing to its random selection of initial centers, unstable results were often got when using traditional K-means and its variants. Here a technique of optimization initial centers of clustering was proposed. Combined with incremental iteration, it can produce clustering results with high purity, low entropy as well as good stableness. |
源URL | [http://124.16.136.157/handle/311060/3282] ![]() |
专题 | 软件研究所_互联网软件技术实验室 _期刊论文 |
推荐引用方式 GB/T 7714 | 赵万磊,王永吉,张学杰,等. 一种优化初始中心点的K平均文本聚类算法[J]. 计算机应用,2005,25(9):2037-2040. |
APA | 赵万磊,王永吉,张学杰,&李娟.(2005).一种优化初始中心点的K平均文本聚类算法.计算机应用,25(9),2037-2040. |
MLA | 赵万磊,et al."一种优化初始中心点的K平均文本聚类算法".计算机应用 25.9(2005):2037-2040. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。