中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于GPU集群的相干消色散算法研究

文献类型:学位论文

作者王博群
答辩日期2021-06-01
文献子类硕士
授予单位中国科学院大学
授予地点北京
导师张海龙
关键词相干消色散 零拷贝 GPU集群 多进程
学位名称理学硕士
学位专业天文技术与方法
其他题名Research on Coherent De-dispersion Algorithm Based on GPU Cluster
英文摘要脉冲星信号在传输过程中受到星际介质的影响会导致轮廓展宽和变形,需要进行消色散处理。具体方法可分为非相干消色散和相干消色散,其中相干消色散可最大限度消除星际介质的色散效应,便于后续的科学研究。但相干消色散过程中需要进行密集浮点运算,消耗大量的计算资源,如何提升算法的效率成为亟待解决的问题。国际上使用GPU集群进行相干消色散已成为主流,通过借助GPU的多线程优势,降低了CPU负载,大大增强了系统的数据处理性能。 针对新疆天文台南山观测站26米射电望远镜(NSRT)实际运行过程中遇到的问题及未来大口径射电望远镜脉冲星实时消色散系统的研制需求,结合实际硬件设备的发展现状,本文对基于GPU集群的相干消色散算法进行了分析研究,主要完成了以下几个方面的工作:(1)分析了星际介质色散效应,探讨了非相干消色散和相干消色散的原理及优缺点。(2)设计并实现了基于零拷贝的GPU相干消色散算法,采用设备内存映射消除了主机到设备的拷贝开销,利用CUDA的cuFFT库进行多BATCH傅里叶变换提高了DFT效率,同时采用多线程实现了传递函数的加速计算。(3)设计并实现了基于集群的相干消色散算法,利用shell多进程实现了任务并行分发及流量控制,并在新疆天文台Taurus高性能计算集群上完成了算法测试。论文主要创新点如下:(1)设计并实现了基于零拷贝的GPU相干消色散算法,使用零拷贝技术消除了主机和设备间的拷贝开销,提高了显存利用率。(2)优化GPU傅里叶变换库cuFFT,对数据进行截取,保证数据长度是2的幂级数,加快了运行速度。利用单精度变换,采取额外空间进行DFT结果缓存,提高了运行效率。通过多批次并行DFT变换,避免了重复调用cufftPlan1d,缩短了算法运行时间。(3) 设计并实现了基于GPU集群的相干消色散算法,使用shell多进程技术实现了任务的并行分发及流量控制。本文分析了星际介质色散效应,介绍了相干消色散的技术原理。设计并实现了基于零拷贝的GPU相干消色散算法,提升了GPU的处理效率。在此基础上设计并实现了基于GPU集群的相干消色散算法,在新疆天文台Taurus高性能计算集群上完成了测试。实验结果证明,集群算法的效率与串行算法相比有较大提升。关键词:相干消色散,零拷贝,GPU集群,多进程
语种中文
页码57
源URL[http://ir.xao.ac.cn/handle/45760611-7/4741]  
专题研究生
作者单位中国科学院新疆天文台
推荐引用方式
GB/T 7714
王博群. 基于GPU集群的相干消色散算法研究[D]. 北京. 中国科学院大学. 2021.

入库方式: OAI收割

来源:新疆天文台

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。