基于神经架构搜索的视觉模型优化
文献类型:学位论文
作者 | 李楠楠![]() |
答辩日期 | 2023-05 |
文献子类 | 博士 |
关键词 | 神经架构搜索 计算机视觉 卷积神经网络 张量环神经网络 视觉Transformer神经网络 演化算法 |
英文摘要 | 作为一种能够自动学习高层次特征表达的机器学习方法,深度学习在许多领域上展现了其强大的性能。尤其在计算机视觉领域,研究人员相继设计了许多新颖且高效的深度神经网络,并在图像处理任务上取得了令人瞩目的成果。其中,卷积神经网络凭借其局部感知与参数共享的特点提升了模型的效率,一跃成为视觉任务中最流行的模型。在此基础上,张量环神经网络通过对优秀的神经网络进行低秩分解降低了模型参数量,缓解了模型冗余,在视觉模型压缩中广为应用。近几年,结合自注意力机制与卷积网络高效的结构设计范式,视觉Transformer 神经网络展示了良好的图像理解能力,在大规模数据集上的性能表现具有绝对优势。然而,上述视觉神经网络的手动设计过程依赖专家经验,耗时且易出错。一方面,结构参数的选择需要大量的实验和调试;另一方面,结构设计的过程高度耦合,不同参数的设置相互影响,难以单独调整和优化。神经架构搜索在给定的搜索空间中采用搜索策略进行神经网络结构的探索,并利用模型评估策略指导搜索策略学习更优的结构。大大减少了网络设计对专家经验的依赖,有效缓解了上述问题。为此,本文针对卷积神经网络、张量环神经网络以及视觉Transformer 神经网络各自的结构特色,提出了相应的高效神经架构搜索算法,实现对视觉神经网络的优化,并在流行的图像基准数据集上对算法有效性进行验证。本文的主要工作和创新点如下: |
语种 | 中文 |
页码 | 120 |
源URL | [http://ir.ia.ac.cn/handle/173211/52147] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 李楠楠. 基于神经架构搜索的视觉模型优化[D]. 2023. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。