基于OpenCL的Viola-Jones人脸检测算法性能优化研究
文献类型:期刊论文
作者 | 贾海鹏; 张云泉; 袁良; 李士刚 |
刊名 | 计算机学报
![]() |
出版日期 | 2016 |
卷号 | 39.0期号:009页码:1775 |
关键词 | OpenCL 负载不均衡 任务队列 线程与任务动态映射 性能移植 |
ISSN号 | 0254-4164 |
英文摘要 | Viola-Jones人脸检测算法是最为成功的可实用的人脸检测算法之一.然而,随着该算法所在领域数据处理规模的不断扩大,现有算法的性能已经越来越无法满足日益增长的交互性与实时性要求.使用GPU计算平台提升该算法性能,以满足日益增长的实时性要求已经成为研究热点.然而,该算法在对GPU的实现和优化中,存在线程间负载不均衡的非规则特性,如果仅使用传统的优化方法,则难以在GPU计算平台上达到较高性能.针对此种情况,该文构建了针对此类算法的并行优化框架,通过Uberkernel、粗粒度并行、Persistent Thread、线程与数据的动态映射、全局及本地队列等优化方法的应用,突破了负载不均衡非规则特性导致的性能瓶颈,大幅提高了人脸检测算法在GPU计算平台上的性能.同时,该文通过对不同GPU计算平台关键性能参数的定义、抽取和传递,实现了该算法在不同GPU计算平台间的性能移植.实验结果表明,与OpenCV2.4中经过高度优化的CPU版本在Intel Xeon X5550CPU上的性能相比,优化后的算法在AMD HD7970和NVIDIA GTX680两个不同GPU计算平台上分别达到了11.24-20.27和9.24-17.62倍的加速比,不仅实现了高性能,而且实现了在不同GPU计算平台间的性能移植. |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/34621] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 贾海鹏,张云泉,袁良,等. 基于OpenCL的Viola-Jones人脸检测算法性能优化研究[J]. 计算机学报,2016,39.0(009):1775. |
APA | 贾海鹏,张云泉,袁良,&李士刚.(2016).基于OpenCL的Viola-Jones人脸检测算法性能优化研究.计算机学报,39.0(009),1775. |
MLA | 贾海鹏,et al."基于OpenCL的Viola-Jones人脸检测算法性能优化研究".计算机学报 39.0.009(2016):1775. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。