深度卷积神经网络量化表示研究
文献类型:学位论文
作者 | 贺翔宇![]() |
答辩日期 | 2022-05 |
文献子类 | 博士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 程健 |
关键词 | 量化表示 特征学习 二值化 深度卷积神经网络 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 量化表示是机器学习领域的一类经典问题,它通过将数据从连续的原空间投影到离散的特征空间,使得计算代价高昂的浮点数乘加操作可以被高效的低数值精度运算替代,从而大幅提升特征向量匹配及以此为基础的相关运算的执行效率。同时,深度卷积神经网络的核心——卷积运算也恰好建立在基于浮点数乘加的相关操作之上,并且卷积层的计算量在深度卷积神经网络总计算量中的占比通常超过90\%。因此,将量化表示引入到深度卷积神经网络的研究中,将为降低深度卷积神经网络的计算复杂度及空间复杂度提供新的思路。 遗憾的是,量化表示在带来计算效率提升的同时,往往也伴随着原始信息的丢失,进而造成模型性能的下降。如何既获取量化表示带来的速度收益,又不过多损失模型表征能力,已经成为深度卷积神经网络量化表示的关键问题。另一方面,对于大量标注数据的依赖性是深度卷积神经网络的另一短板。事实上,用户在期望获得更加轻量化的模型时,并不希望暴露自身的私有数据,这对于已有的基于有标签数据集进行再训练的量化表示算法提出了新的挑战。具体地,深度卷积神经网络量化表示存在如下亟待解决的问题:如何在梯度更新框架下求解量化表示中的离散优化问题、量化表示在小样本/零样本环境下的学习方法应如何设计等。针对以上问题,本文从量化表示学习的角度对深度卷积神经网络模型压缩与加速展开了如下研究: |
语种 | 中文 |
页码 | 132 |
源URL | [http://ir.ia.ac.cn/handle/173211/48482] ![]() |
专题 | 自动化研究所_毕业生 |
推荐引用方式 GB/T 7714 | 贺翔宇. 深度卷积神经网络量化表示研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。