基于密度比例的密度峰值聚类算法
文献类型:期刊论文
作者 | 高诗莹; 周晓锋![]() ![]() |
刊名 | 计算机工程与应用
![]() |
出版日期 | 2017 |
卷号 | 53期号:16页码:10-17 |
关键词 | 聚类 密度峰值 密度比例 密度变化 |
ISSN号 | 1002-8331 |
其他题名 | Clustering by fast search and find of density peaks based on density-raito |
产权排序 | 1 |
通讯作者 | 高诗莹 |
中文摘要 | CFSFDP(Clustering by Fast Search and Find of Density Peaks)是一种新的基于密度的聚类算法。该算法可以对非球形分布的数据聚类,有待调节参数少、聚类速度快等优点。但是对于类簇间密度相差较大的数据,该算法容易遗漏密度较小的类簇而影响聚类的准确率。针对这一问题,提出了基于密度比例峰值聚类算法即R-CFSFDP。该算法将密度比例引入到CFSFDP中,通过计算样本数据的密度比峰值来提高数据中密度较小类簇的辨识度,进而提升整体聚类的准确率。基于9个常用测试数据集(2个人工合成数据集,7个UCI数据集)的聚类实验结果表明,对于类簇间密度相差较大和类簇形状复杂的数据聚类问题,R-CFSFDP能够使得类簇中心更加清晰、易确定,聚类结果更好。 |
英文摘要 | CFSFDP(Clustering by Fast Search and Find of Density Peaks)is a new density-based clustering algorithm, which can cluster the non-spherical data with fewer parameters and high speed of clustering. However, when the density of different clusters vary widely, it is hard to find the clusters with sparse density, so that the accuracy of clustering will be decreased. To solve this problem, this paper proposes a density-raito based CFSFDP that short of R-CFSFDP. In this algorithm, the density-ratio is introduced into CFSFDP to make clusters with sparse density easily identifiable. To validate the algorithm, experiments are conducted with 9 data sets(2 synthetic data sets, 7 UCI data sets). The experimental results show that, when the cluster shape is complex and the density of different clustersvary widely, it makes the cluster centers easier to be determined and has a higher accuracy of the clustering than CFSFDP. |
收录类别 | CSCD |
语种 | 中文 |
CSCD记录号 | CSCD:6056403 |
源URL | [http://ir.sia.cn/handle/173321/20968] ![]() |
专题 | 沈阳自动化研究所_数字工厂研究室 |
作者单位 | 1.东北大学计算机科学与工程学院 2.中国科学院网络化控制系统重点实验室 3.中国科学院沈阳自动化研究所 |
推荐引用方式 GB/T 7714 | 高诗莹,周晓锋,李帅. 基于密度比例的密度峰值聚类算法[J]. 计算机工程与应用,2017,53(16):10-17. |
APA | 高诗莹,周晓锋,&李帅.(2017).基于密度比例的密度峰值聚类算法.计算机工程与应用,53(16),10-17. |
MLA | 高诗莹,et al."基于密度比例的密度峰值聚类算法".计算机工程与应用 53.16(2017):10-17. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。