加速大数据聚类K-means算法的改进
文献类型:期刊论文
作者 | 韩岩;李晓; 李晓![]() |
刊名 | 计算机工程与设计
![]() |
出版日期 | 2015 |
卷号 | 36期号:5页码:1317-1320 |
关键词 | K-均值算法 随机抽样 最大最小距离法 映射归约 并行化 |
中文摘要 | 为有效处理大规模数据聚类的问题,提出一种先抽样再用最大最小距离进行K-means并行化聚类的方法。基于抽样的方法避免了聚类陷入局部解中,基于最大最小距离法使得初始聚类中心趋于最优化。大量实验结果表明,无论是在单机环境还是集群环境下,该方法受初始聚类中心的影响降低,提高了聚类的准确性,减少了聚类的迭代次数,降低了聚类的时间。 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/4521] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
作者单位 | 中国科学院新疆理化技术研究所;中国科学院大学计算机与控制学院 |
推荐引用方式 GB/T 7714 | 韩岩;李晓,李晓. 加速大数据聚类K-means算法的改进[J]. 计算机工程与设计,2015,36(5):1317-1320. |
APA | 韩岩;李晓,&李晓.(2015).加速大数据聚类K-means算法的改进.计算机工程与设计,36(5),1317-1320. |
MLA | 韩岩;李晓,et al."加速大数据聚类K-means算法的改进".计算机工程与设计 36.5(2015):1317-1320. |
入库方式: OAI收割
来源:新疆理化技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。