基于深度学习的大空间变换下细粒度图像分类算法研究
文献类型:学位论文
作者 | 王军鹏![]() |
答辩日期 | 2020-05-27 |
文献子类 | 硕士 |
授予单位 | 中国科学院大学 |
授予地点 | 北京 |
导师 | 乔红 |
关键词 | 细粒度图像分类 深度学习 空间变换网络 双线性网络 空间变换 |
学位名称 | 工学硕士 |
学位专业 | 控制理论与控制工程 |
英文摘要 | 随着深度学习技术的不断发展,图像分类算法已经在多个数据集上超过了人眼的分别能力。结合实际场景的需求,细粒度图像分类任务也受到了越来越多的关注。细粒度图像分类任务是指对同一父类别下的不同子类别进行分类。细粒度图像分类可以辅助各个特定专业领域的研究。 细粒度图像分类主要有两个难点:一是同一类别下样本的外观是相似的,该类别下图像的差异主要由样本的空间变换产生;二是各类别间的差异一般仅体现在样本的部件上。两难点使普通的图像分类算法不适用于此任务。 本文针对细粒度图像分类任务的两个难点,结合多种卷积神经网络进行了算法设计。本文的主要工作和贡献如下:
为探究空间变换对神经网络性能的影响,在MNIST手写数字数据集上设计了空间扰动下的分类实验。定量地对原始图片添加不同幅度的仿射变换扰动,并观察神经网络的性能变化。结果表明:1. 神经网络对样本小范围的基本空间变换具有鲁棒性;2. 卷积神经网络抵抗空间变换的效果优于全连接网络。3. 多种基本变换组合形成的复杂变换将使卷积网络性能急剧降低。
针对细粒度样本类内空间变换大的缺点,我们引入了空间变换网络(spatial transformer networks,STN)。针对STN应用在细粒度数据集上的边缘损失问题,我们提出了重叠区域(intersection area, IA)损失,并从理论上论证了其可行性。我们在多个数据集上进行了分类实验,得到了最优的IA损失系数,并验证了模型的性能优势。
针对细粒度分类任务的两个难点,引入了适用于细粒度分类任务的双线性网络(Bilinear CNN,BCNN)。双线性以外积的计算方式捕获了不同通道之间的相关性,产生了具有判别性的特征。将双线性网络与改进的STN结合,提出了一种新的网络结构ST-BCNN。为了捕获各个通道间的非线性关系,将多项式核函数引入ST-BCNN,得到了Kernel ST-BCNN。我们在三个数据集上进行了实验。通过实验得到了多项式核的最优次数,并验证了模型相对其他经典方法的优势。
|
语种 | 中文 |
页码 | 95 |
源URL | [http://ir.ia.ac.cn/handle/173211/39087] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 王军鹏. 基于深度学习的大空间变换下细粒度图像分类算法研究[D]. 北京. 中国科学院大学. 2020. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。