中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
深度神经网络结构:从人工设计到自动学习

文献类型:学位论文

作者钟钊
答辩日期2019-05
文献子类博士
授予单位中国科学院大学
授予地点中科院自动化研究所
导师刘成林
关键词深度神经网络 深度学习 网络结构搜索 强化学习 机器学习
学位名称工学博士
学位专业模式识别与智能系统
英文摘要

设计深度神经网络结构是一件非常困难的工作,它需要高级专家的经验和知识、大量的试错尝试、甚至灵感。而随着网络性能的不断上升,网络结构越来越复杂,网络模型的提升也越来越困难。所以近年来,一些前沿的工作开始关注让计算机自动设计(搜索)出性能优秀的深度神经网络结构。但是,当前的自动化方法还存在着计算消耗巨大、泛化性差、速度慢等一系列挑战。本文首先从特定任务的神经网络结构入手,人工地进行了深度神经网络结构的修改和设计,并在此基础上针对自动化神经网络结构设计方法展开了深入的研究。主要贡献总结如下:

  1. 提出了一种人工设计的针对中文手写字符识别的深度神经网络结构模型。该模型包含两个模块:空间变换网络和残差网络。空间变换网络通过数据自动地学习出适合输入中文文字样本的仿射变换矩阵,自动地将输入中文文字图片进行矫正,以提高最终的识别率。残差网络使用残差连接网络结构缓解了深度神经网络梯度消失和爆炸的问题,使得网络学习特征的能力大大加强。在公开数据集上的实验结果表明,本方法取得了最佳性能并且能起到矫正中文手写文字的作用。
  2. 提出了一种人工设计的针对视觉跟踪决策的深度神经网络结构模型。该模型主要由一个卷积神经网络作为决策控制器,并通过强化学习算法进行决策的更新学习。神经网络决策控制器可以在视觉跟踪任务上针对不同的场景做出合理的决策选择。在单目标跟踪任务上,可以利用本方法来集成多个目标跟踪器,动态化地选择最优的目标跟踪框,以提高准确率。在多目标跟踪任务上,可以利用本方法对目标跟踪器进行动态切换,从而提升多目标跟踪算法的效率。在公开数据集上的实验结果表明,本方法在单目标跟踪上取得了最佳的性能并在多目标跟踪问题上大大提高了算法的速度。
  3. 提出了基于强化学习和分块思想的自动化深度神经网络结构搜索框架。该框架首次将网络分块的思想引入自动化神经网络结构搜索领域,使得网络搜索空间大大降低,网络生成速度加快,并且让生成的网络结构获得了优秀的泛化能力。该框架具体包括三个部分:分块网络搜索空间,强化学习控制器,提前停止策略。我们首先在分块网络搜索空间中提出了一种通用的神经网络结构编码,用来表示任意的深度神经网络结构。然后根据这种通用神经网络编码,我们构建了基于强化学习的控制器,用来进行神经网络结构的采样和搜索。最后采取提前停止策略对搜索网络进行训练评价,并使用分布式异构框架,让整个网络生成的速度进一步的加快。在CIFAR-10、CIFAR-100和ImageNet三个公开的图像分类数据集上,该方法搜索产生的网络结构都取得最佳的性能,验证了其超越人类设计网络结构的超强能力。
  4. 提出了快速深度神经网络结构搜索方法和网络连接搜索方法,完善了整个自动化神经网络结构搜索框架。绝大部分自动化深度神经网络结构搜索算法需要非常耗时的网络性能评估过程,该方法首先通过通用分块神经网络结构编码对生成的网络进行表示,然后将编码信息经过层嵌入映射为向量,输入到长短期记忆网络进行训练学习,最后通过多层感知器直接预测出输入网络结构的具体性能。实验结果表明该方法大大地降低了计算消耗,在CIFAR数据集上,仅仅需要一块显卡运行一天时间,就可以搜索出具有竞争力的深度神经网络结构,相对常规方法计算量降低到了千分之一以下。并且在原有基于强化学习和分块网络思想的自动化神经网络结构搜索框架的基础上,通过改变搜索空间设计,提出了一个自动搜索分块网络最优连接的方法。实验结果表明,通过这种方法可以找到优于人类先验知识定义的分块网络堆叠方式,完善了分块网络结构组网的工作。

 

语种中文
页码124
源URL[http://ir.ia.ac.cn/handle/173211/23872]  
专题自动化研究所_模式识别国家重点实验室_模式分析与学习团队
推荐引用方式
GB/T 7714
钟钊. 深度神经网络结构:从人工设计到自动学习[D]. 中科院自动化研究所. 中国科学院大学. 2019.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。