基于Spark的标准化PCA算法
文献类型:期刊论文
作者 | 董建华; 王国胤; 雍熙; 史晓雨![]() |
刊名 | 郑州大学学报(工学版)
![]() |
出版日期 | 2017-08-21 |
期号 | 5页码:7-12 |
关键词 | 主成分分析 Spark 分布式 标准化处理 |
英文摘要 | 主成分分析(PCA)是数据挖掘中常用的数据降维技术,它将原来多个变量转化为少数的几个综合指标,介绍了主成分分析的原理、Spark的分布式架构以及Spark的MLlib分布式矩阵PCA算法,通过改进设计提出了一种带有标准化处理的SNPCA算法,并在多核CPU环境下进行了测试验证,实验结果证明了该算法的有效性. |
语种 | 中文 |
源URL | [http://119.78.100.138/handle/2HOD01W0/5165] ![]() |
专题 | 大数据挖掘及应用中心 |
作者单位 | (1) 中国科学院重庆绿色智能技术研究院电子信息技术研究所(2)中国科学院大学(3)水利部水利信息中心(4)西昌卫星发射中心 |
推荐引用方式 GB/T 7714 | 董建华,王国胤,雍熙,等. 基于Spark的标准化PCA算法[J]. 郑州大学学报(工学版),2017(5):7-12. |
APA | 董建华,王国胤,雍熙,史晓雨,&李庆亮.(2017).基于Spark的标准化PCA算法.郑州大学学报(工学版)(5),7-12. |
MLA | 董建华,et al."基于Spark的标准化PCA算法".郑州大学学报(工学版) .5(2017):7-12. |
入库方式: OAI收割
来源:重庆绿色智能技术研究院
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。