热门
最优聚类个数和初始聚类中心点选取算法研究
文献类型:期刊论文
作者 | 赵怀慈![]() |
刊名 | 计算机应用研究
![]() |
出版日期 | 2017 |
卷号 | 34期号:6页码:1617-1620 |
关键词 | K-means 算法 聚类中心 准确率 误差平方和 |
ISSN号 | 1001-3695 |
其他题名 | Algorithm research of optimal cluster number and initial cluster center |
产权排序 | 1 |
通讯作者 | 张素洁 |
中文摘要 | 传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定,且准确率较低。基于SSE用来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集,其次聚类中心点之间距离相对较远的选取原则用来选取初始聚类中心点,避免初始聚类中心点集中在一个小的范围,防止陷入局部最优。实验证明,能选取最优的k值,通过用标准的 UCI数据库进行试验,采用的算法能选择出唯一的初始中心点,聚类准确率较高,误差平方和较小。 |
英文摘要 | The cluster k of traditional K-means algorithm could not determine beforehand and the initial clustering centers of k-means algorithm are randomly selected, which may result in low accuracy and unstable clustering. In this paper, based on the SSE for selecting the number of clusters k, based on the principle that the clustering center of the surrounding area is relatively dense, and between the clustering center distance is relatively far, to avoid the initial clustering center focused on a small range, prevent fall into local optimum. Tests show that ,this paper can select the optimal value of k, in the case of the number of categories k is given ,used the standard UCI data sets for test. this paper can choose the only center of initial clustering and the higher accuracy, the improved selection of initial centers in this paper have the minimum errors. |
收录类别 | CSCD |
语种 | 中文 |
CSCD记录号 | CSCD:6017038 |
源URL | [http://ir.sia.cn/handle/173321/19386] ![]() |
专题 | 沈阳自动化研究所_光电信息技术研究室 |
作者单位 | 1.中国科学院沈阳自动化研究所 2.辽宁省图像理解与视觉计算重点实验室 3.中国科学院光电信息处理重点实验室 4.中国科学院大学 |
推荐引用方式 GB/T 7714 | 赵怀慈,张素洁. 最优聚类个数和初始聚类中心点选取算法研究[J]. 计算机应用研究,2017,34(6):1617-1620. |
APA | 赵怀慈,&张素洁.(2017).最优聚类个数和初始聚类中心点选取算法研究.计算机应用研究,34(6),1617-1620. |
MLA | 赵怀慈,et al."最优聚类个数和初始聚类中心点选取算法研究".计算机应用研究 34.6(2017):1617-1620. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。