中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于Spark的标准化PCA算法

文献类型:期刊论文

作者董建华; 王国胤; 雍熙; 史晓雨; 李庆亮
刊名郑州大学学报(工学版)
出版日期2017-08-21
期号5页码:7-12
关键词主成分分析 Spark 分布式 标准化处理
英文摘要主成分分析(PCA)是数据挖掘中常用的数据降维技术,它将原来多个变量转化为少数的几个综合指标,介绍了主成分分析的原理、Spark的分布式架构以及Spark的MLlib分布式矩阵PCA算法,通过改进设计提出了一种带有标准化处理的SNPCA算法,并在多核CPU环境下进行了测试验证,实验结果证明了该算法的有效性.
语种中文
源URL[http://119.78.100.138/handle/2HOD01W0/5165]  
专题大数据挖掘及应用中心
作者单位(1) 中国科学院重庆绿色智能技术研究院电子信息技术研究所(2)中国科学院大学(3)水利部水利信息中心(4)西昌卫星发射中心
推荐引用方式
GB/T 7714
董建华,王国胤,雍熙,等. 基于Spark的标准化PCA算法[J]. 郑州大学学报(工学版),2017(5):7-12.
APA 董建华,王国胤,雍熙,史晓雨,&李庆亮.(2017).基于Spark的标准化PCA算法.郑州大学学报(工学版)(5),7-12.
MLA 董建华,et al."基于Spark的标准化PCA算法".郑州大学学报(工学版) .5(2017):7-12.

入库方式: OAI收割

来源:重庆绿色智能技术研究院

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。