基于Spark平台的XP-EHH算法的分布式处理实现方法
文献类型:专利
| 作者 | 周维; 谢海兵; 刘长春; 罗静; 张亚平 |
| 发表日期 | 2016-11-07 |
| 专利国别 | 中国 |
| 专利号 | CN106503225A |
| 专利类型 | 发明 |
| 权利人 | 云南大学 |
| 中文摘要 | 本发明公开了一种基于Spark平台的XP‑EHH算法的分布式处理实现方法,首先采集染色体数据,存储至HDFS文件系统,然后对染色体数据进行预处理,将预处理后的染色体数据缓存至Spark平台的RDD缓存中,将需要使用的数据广播到参与XP‑EHH算法分布式处理的Spark工作节点中;将ped文件RDD拆分成不同的片段,发放给各个Spark工作节点,各个Spark工作节点并行化地执行XP‑EHH计算的各个步骤,从而实现分布式处理。采用本发明可以因为XP‑EHH算法的并行化执行,使得在大数据环境下基于Spark平台的XP‑EHH算法能够保持良好的扩展性,进而能够克服现有实现方式无法支持大数据的问题。 |
| 公开日期 | 2017-03-15 |
| 申请日期 | 2016-11-07 |
| 语种 | 中文 |
| 专利申请号 | 201610972593.7 |
| 源URL | [http://159.226.149.26:8080/handle/152453/11631] ![]() |
| 专题 | 昆明动物研究所_分子进化基因组学 |
| 作者单位 | 1.云南大学 2.中国科学院昆明动物研究所 |
| 推荐引用方式 GB/T 7714 | 周维,谢海兵,刘长春,等. 基于Spark平台的XP-EHH算法的分布式处理实现方法. CN106503225A. 2016-11-07. |
入库方式: OAI收割
来源:昆明动物研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
