中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于Spark平台的XP-EHH算法的分布式处理实现方法

文献类型:专利

作者周维; 谢海兵; 刘长春; 罗静; 张亚平
发表日期2016-11-07
专利国别中国
专利号CN106503225A
专利类型发明
权利人云南大学
中文摘要本发明公开了一种基于Spark平台的XP‑EHH算法的分布式处理实现方法,首先采集染色体数据,存储至HDFS文件系统,然后对染色体数据进行预处理,将预处理后的染色体数据缓存至Spark平台的RDD缓存中,将需要使用的数据广播到参与XP‑EHH算法分布式处理的Spark工作节点中;将ped文件RDD拆分成不同的片段,发放给各个Spark工作节点,各个Spark工作节点并行化地执行XP‑EHH计算的各个步骤,从而实现分布式处理。采用本发明可以因为XP‑EHH算法的并行化执行,使得在大数据环境下基于Spark平台的XP‑EHH算法能够保持良好的扩展性,进而能够克服现有实现方式无法支持大数据的问题。 
公开日期2017-03-15
申请日期2016-11-07
语种中文
专利申请号201610972593.7
源URL[http://159.226.149.26:8080/handle/152453/11631]  
专题昆明动物研究所_分子进化基因组学
作者单位1.云南大学
2.中国科学院昆明动物研究所
推荐引用方式
GB/T 7714
周维,谢海兵,刘长春,等. 基于Spark平台的XP-EHH算法的分布式处理实现方法. CN106503225A. 2016-11-07.

入库方式: OAI收割

来源:昆明动物研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。