中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种基于双聚类的缺失数据填补方法

文献类型:期刊论文

作者郝胜轩; 宋宏; 周晓锋
刊名计算机应用研究
出版日期2015
卷号32期号:3页码:674-678
关键词缺失数据填补 双聚类 双聚类数据填补 数据清洗
ISSN号1001-3695
其他题名Novel approach for missing data imitation based on biclustering
产权排序1
中文摘要针对现实数据集的数据缺失问题,本文提出了一种基于双聚类的缺失数据填补新方法。首先,该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转化为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据集中缺失元素的预测。其次,该算法利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解,并进行了数学上的分析证明。最后,进行仿真验证,通过观察UCI数据集的实验结果可知,本文所提出的算法具有较高的填补准确性。
英文摘要In view of the problem of the lack of realistic data sets,this paper proposed a novel imputation method based on biclustering is proposed to solve the missing data problem. Firstly,the proposed method transformed the problem of imputing missing data into the problem of specific bicluster’minimum mean squared residue,which utilized the characteristics of the bicluster data that the smaller bicluster’s mean squared residue the higher similarity,thus the proposed method could predict the missing data in data sets. Secondly,it employed a solving minimization strategy of quadratic function to solve the problem of specific bicluster’s minimum mean squared residue,and gave the corresponding mathematical proof. Finally,it executed simulation and verification,and gave the results of UCI data sets show that the proposed imputation method has higher accuracy compared with other imputation methods.
收录类别CSCD
资助信息国家重大科技专项
语种中文
CSCD记录号CSCD:5357059
公开日期2015-03-17
源URL[http://ir.sia.ac.cn/handle/173321/15731]  
专题沈阳自动化研究所_数字工厂研究室
推荐引用方式
GB/T 7714
郝胜轩,宋宏,周晓锋. 一种基于双聚类的缺失数据填补方法[J]. 计算机应用研究,2015,32(3):674-678.
APA 郝胜轩,宋宏,&周晓锋.(2015).一种基于双聚类的缺失数据填补方法.计算机应用研究,32(3),674-678.
MLA 郝胜轩,et al."一种基于双聚类的缺失数据填补方法".计算机应用研究 32.3(2015):674-678.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。