中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于信息熵的混合属性数据谱聚类算法

文献类型:期刊论文

作者朱军1,3; 姜智涵1,2,3; 李帅1,2,3; 周晓锋1,3
刊名计算机应用研究
出版日期2018
卷号36期号:8页码:2256-2260
关键词混合属性数据 谱聚类 高斯核函数 影响因子
ISSN号1001-3695
其他题名Entropy-based spectral clustering algorithm for mixed type data
产权排序1
英文摘要

针对传统的聚类算法只能处理单属性的数据,不能很好地处理混合属性数据的聚类问题,以及目前大多数混合属性数据聚类算法对初始化敏感、不能处理任意形状的数据的问题,提出一种基于信息熵的混合属性数据谱聚类算法,用于处理混合类型数据。首先,提出了一种新的相似性度量方式,利用谱聚类算法中的数值型数据构成的高斯核函数矩阵与新的基于信息熵的分类型数据构成的影响因子矩阵相结合代替了传统的相似度矩阵,新的相似度矩阵避免了数值属性与分类属性数据之间的转换和参数调整;然后,把新的相似度矩阵运用到谱聚类算法中,以便于处理任意形状的数据,最终得出聚类结果。通过在UCI的数据集上的实验表明,该算法能有效地处理混合属性数据的聚类问题,且具有较高的稳定性以及良好的鲁棒性。

语种中文
CSCD记录号CSCD:6549502
资助机构工信部智能制造综合标准化与新模式应用项目(Y6L8283A01)
源URL[http://119.78.100.139/handle/173321/21864]  
专题沈阳自动化研究所_数字工厂研究室
通讯作者姜智涵
作者单位1.中国科学院网络化控制系统重点实验室
2.中国科学院大学;
3.中国科学院沈阳自动化研究所;
推荐引用方式
GB/T 7714
朱军,姜智涵,李帅,等. 基于信息熵的混合属性数据谱聚类算法[J]. 计算机应用研究,2018,36(8):2256-2260.
APA 朱军,姜智涵,李帅,&周晓锋.(2018).基于信息熵的混合属性数据谱聚类算法.计算机应用研究,36(8),2256-2260.
MLA 朱军,et al."基于信息熵的混合属性数据谱聚类算法".计算机应用研究 36.8(2018):2256-2260.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。