中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向深度学习的DNN高效计算方法研究

文献类型:学位论文

作者赵天理
答辩日期2023-05
文献子类博士
关键词深度神经网络 结构化剪枝 非结构化剪枝 单指令多数据
英文摘要

近年来,基于深度神经网络(Deep Neural Networks, DNN)的相关技术和算法,以其接近人类,甚至超越人类水平的优越性能,在诸如图像分类,目标检测等视觉领域中获得了越来越广泛的应用,在人们的生产与生活中扮演着越来越重要的角色。然而,相较于传统算法,这些基于DNN的视觉算法往往需要巨大的内存和计算资源。而另一方面,随着人们的生活越来越依赖于日渐普及的移动设备,将这些算法部署于移动计算设备的需求也日益增长。而这些设备无论是内存还是计算资源,都极其受限,这一矛盾给DNN模型的移动端部署带来了极大的挑战。为了解决以上问题,本文开展了面向移动设备的深度神经网络高效计算方法研究。根据移动计算设备特有的硬件特性和计算架构,对深度神经网络进行定制化的压缩和结构设计,从而使模型能够更加高效地部署于资源受限的移动计算设备上。具体来讲,本文的主要贡献如下:

 

1. 面向移动设备的高效卷积算法。卷积是深度神经网络中的核心运算,要想实现深度神经网络的移动端高效部署,首先要解决卷积的高效计算问题。在移动设备上,受资源限制,内存占用和运算性能都是高效卷积计算算法必须要考虑的关键因素。为此,本文提出了基于分块重组的快速卷积算法(Efficient Convolution via Blocked Columnizing, ECBC)。该算法将卷积计算的过程进行精心地迭代重排和分块。通过共享内存,缓存优化,单指令多数据(Single Instruction Multiple Data, SIMD)优化等多种技术手段,在大大降低了计算所需的内存占用的同时,提高了卷积的计算性能。

 

2. 面向移动设备的网络压缩模式。 除了在软件层面设计面向移动设备的高效卷积计算算法之外,在模型层面进行网络压缩也是实现模型的移动端高效计算的重要手段。为了更好地实现模型加速,在模型压缩模式设计时充分考虑目标部署设备的计算架构是十分必要的。本文考虑到大多数现代移动CPU中均采用单指令多数据(Single Instruction Multiple Data, SIMD)技术来提高设备的数据并行化处理能力,提出了SIMD结构化稀疏神经网络,以及一个高效的SIMD结构化稀疏卷积算法。相比于传统的结构化通道剪枝算法,SIMD结构化剪枝算法在稀疏结构上具有更强的灵活性,因此可以达到更高的精度;而相比于非结构化随机剪枝算法,SIMD结构化剪枝算法的参数保留了一定的结构性,有利于充分利用现代CPU中常用的SIMD技术,因此可以得到更好的网络加速效果。

 

 3. 面向移动设备的网络多粒度联合剪枝。SIMD结构化剪枝技术和快速稀疏卷积算法的提出为非结构化剪枝用于网络加速提供了新的可能。不同的剪枝方法对网络的精度和速度都有不同的影响,为了结合多种不同的剪枝方法的优势,从而更好地进行网络加速,本文提出网络多粒度联合剪枝。该方法同时对网络进行结构化通道剪枝和非结构化剪枝,并通过一个改进的多目标遗传算法来自动寻找网络结构化通道剪枝与非结构化剪枝之间的最佳平衡。该方法可以只经过一次搜索同时得到多个具有不同运行时间的模型结构,大量的实验证明该方法可以在网络的精度和运行速度之间达到比已有算法更好的平衡。

 

学科主题计算机感知 ; 计算机神经网络 ; 并行处理 ; 计算机运行测试与性能评价
语种中文
页码120
源URL[http://ir.ia.ac.cn/handle/173211/52085]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
赵天理. 面向深度学习的DNN高效计算方法研究[D]. 2023.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。