中国科学院机构知识库网格系统: 面向GPU的循环合并

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

面向GPU的循环合并

文献类型：期刊论文


作者	杨扬; 崔慧敏; 冯晓兵
刊名	高技术通讯
出版日期	2013
卷号	23.0 期号:003 页码:257
关键词	通用图形处理单元（GPU）循环合并并行 CUDA 循环间数据重用
ISSN号	1002-0470
英文摘要	针对现有的将C或Fortran程序映射到通用图形处理单元（GPU）的自动转换工具主要关注将单个循环生成一个独立的GPU内核，从而阻碍了对循环间数据重用的利用的问题，提出一种新的面向GPU的循环合并的代码变换方法，该方法通过循环分块（stripmining）和冗余计算等手段达到消除迭代间数据依赖的目的，并可充分利用GPU片上的共享内存进行线程间数据交换，从而将此类程序高效地映射到GPU上。通过典型程序在GPU上的实验表明，该新方法由于能够减少对全局内存的访问，带来了最多高达1．96倍的加速比。
语种	英语
源URL	[http://119.78.100.204/handle/2XEOYT63/33834]
专题	中国科学院计算技术研究所期刊论文_中文
作者单位	中国科学院计算技术研究所
推荐引用方式 GB/T 7714	杨扬,崔慧敏,冯晓兵. 面向GPU的循环合并[J]. 高技术通讯,2013,23.0(003):257.
APA	杨扬,崔慧敏,&冯晓兵.(2013).面向GPU的循环合并.高技术通讯,23.0(003),257.
MLA	杨扬,et al."面向GPU的循环合并".高技术通讯 23.0.003(2013):257.

入库方式： OAI收割

来源：计算技术研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。