格子Boltzmann方法多GPU并行性能的研究
文献类型:期刊论文
作者 | 张纲; 王利民; 葛蔚 |
刊名 | 计算机与应用化学
![]() |
出版日期 | 2017 |
卷号 | 34期号:10页码:739-748 |
关键词 | 格子boltzmann方法 Tesla P100 性能 |
英文摘要 | 基于CUDA和MPI实现了格子Boltzmann方法的多GPU并行计算,利用程序对Tesla K80和Tesla P100的性能进行了测试,结果表明:Tesla P100有着远超Tesla K80的计算性能。单GPU下,P100在计算规模为2563达到最大值2880.0 MLUPS,K80在规模为384~3达到最大值801.6 MLUPS;在多GPU并行时,GPU间通信会带来计算性能的损失,但是P100较K80仍具有较大的提升;测定函数LBCollProp在不同规模下运行时间以及其在程序总运行时间中的占比,由此可以预估程序运行一定时间步的耗时。 |
语种 | 中文 |
源URL | [http://ir.ipe.ac.cn/handle/122111/25166] ![]() |
专题 | 中国科学院过程工程研究所 |
作者单位 | 1.中国科学院过程工程研究所多相复杂系统国家重点实验室 2.中国科学院大学 |
推荐引用方式 GB/T 7714 | 张纲,王利民,葛蔚. 格子Boltzmann方法多GPU并行性能的研究[J]. 计算机与应用化学,2017,34(10):739-748. |
APA | 张纲,王利民,&葛蔚.(2017).格子Boltzmann方法多GPU并行性能的研究.计算机与应用化学,34(10),739-748. |
MLA | 张纲,et al."格子Boltzmann方法多GPU并行性能的研究".计算机与应用化学 34.10(2017):739-748. |
入库方式: OAI收割
来源:过程工程研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。