中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
格子Boltzmann方法多GPU并行性能的研究

文献类型:期刊论文

作者张纲; 王利民; 葛蔚
刊名计算机与应用化学
出版日期2017
卷号34期号:10页码:739-748
关键词格子boltzmann方法 Tesla P100 性能
英文摘要

基于CUDA和MPI实现了格子Boltzmann方法的多GPU并行计算,利用程序对Tesla K80和Tesla P100的性能进行了测试,结果表明:Tesla P100有着远超Tesla K80的计算性能。单GPU下,P100在计算规模为2563达到最大值2880.0 MLUPS,K80在规模为384~3达到最大值801.6 MLUPS;在多GPU并行时,GPU间通信会带来计算性能的损失,但是P100较K80仍具有较大的提升;测定函数LBCollProp在不同规模下运行时间以及其在程序总运行时间中的占比,由此可以预估程序运行一定时间步的耗时。

语种中文
源URL[http://ir.ipe.ac.cn/handle/122111/25166]  
专题中国科学院过程工程研究所
作者单位1.中国科学院过程工程研究所多相复杂系统国家重点实验室
2.中国科学院大学
推荐引用方式
GB/T 7714
张纲,王利民,葛蔚. 格子Boltzmann方法多GPU并行性能的研究[J]. 计算机与应用化学,2017,34(10):739-748.
APA 张纲,王利民,&葛蔚.(2017).格子Boltzmann方法多GPU并行性能的研究.计算机与应用化学,34(10),739-748.
MLA 张纲,et al."格子Boltzmann方法多GPU并行性能的研究".计算机与应用化学 34.10(2017):739-748.

入库方式: OAI收割

来源:过程工程研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。