异构平台上基于OpenCL的FFT实现与优化
文献类型:期刊论文
作者 | 李焱 ; 张云泉 ; 王可 ; 赵美超 |
刊名 | 计算机科学
![]() |
出版日期 | 2011 |
期号 | 8页码:284-286,296 |
关键词 | FFT OpenCL Cell CUDA GPU 快速傅立叶变换 |
中文摘要 | 快速傅立叶变换作为20世纪公认的最重要的基础算法之一,在大规模科学计算处理、数字信号处理、图形图像仿真等众多领域有着广泛的应用。OpenCL是首个面向异构系统通用的并行编程标准,为软件开发人员提供了统一的面向异构系统的并行编程环境。首先,在异构平台Cell和GPU上使用OpenCL实现了基于2的幂一维FFT,并对其进行了测试和分析,在Cell平台上当数据规模适中时它能够达到SDK性能的65%,当数据规模继续增大时,相对性能有所降低。此外,针对Nvidia Fermi平台,手工调优了小因子的FFT,使其性能接近于CUFFT的140%。 |
公开日期 | 2011-10-10 |
源URL | [http://124.16.136.157/handle/311060/13745] ![]() |
专题 | 软件研究所_并行计算实验室 _期刊论文 |
推荐引用方式 GB/T 7714 | 李焱,张云泉,王可,等. 异构平台上基于OpenCL的FFT实现与优化[J]. 计算机科学,2011(8):284-286,296. |
APA | 李焱,张云泉,王可,&赵美超.(2011).异构平台上基于OpenCL的FFT实现与优化.计算机科学(8),284-286,296. |
MLA | 李焱,et al."异构平台上基于OpenCL的FFT实现与优化".计算机科学 .8(2011):284-286,296. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。