基于OpenCL的图像模糊化算法优化研究
文献类型:会议论文
作者 | 张樱 ; 张云泉 ; 龙国平 |
出版日期 | 2011 |
会议名称 | 2011年全国高性能计算学术年会(HPC china2011) |
会议日期 | 2011 |
会议地点 | 济南 |
关键词 | AMD GPU blur OpenCL 图像对象 |
页码 | 1-6 |
中文摘要 | 现代GPU一般都提供特定硬件(如纹理部件、光栅化部件及各种片上缓存)以加速二维图像的处理和显示过程,相应的编程模型(CUDA、OpenCL)都定义了特定程序设计接口(CUDA的纹理内存,OpenCL的图像对象)便于图像应用能利用相关硬件支持。以典型图像模糊化处理算法在AMD平台GPU的优化为例,探讨OpenCL的图像对象在图像算法优化上的适用范围,尤其是其相对于更通用的基于全局内存加片上局部存储进行性能优化方法的优劣。实验结果表明图像对象只有在图像为四通道且计算过程中需要缓存的数据量较小时能带来较好的性能改善,其余情况采用全局内存加局部存储能获得更好性能。优化后的算法性能相对于精心实现的CPU版加速比为200-1000;相对于NVIDIA NPP库相应函数的性能加速比为1.3-5。 |
收录类别 | WANFANG |
会议主办者 | 中国计算机学会 |
语种 | 中文 |
源URL | [http://ir.iscas.ac.cn/handle/311060/16333] ![]() |
专题 | 软件研究所_软件所图书馆_会议论文 |
推荐引用方式 GB/T 7714 | 张樱,张云泉,龙国平. 基于OpenCL的图像模糊化算法优化研究[C]. 见:2011年全国高性能计算学术年会(HPC china2011). 济南. 2011. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。