中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于轻量化网络的目标检测算法研究

文献类型:学位论文

作者李鸿
答辩日期2022-05
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院光电技术研究所
关键词深度学习 实时目标检测 轻量化网络 嵌入式平台 Alpha-iou Loss
学位名称工学硕士
英文摘要

基于深度神经网络的目标检测方法在现代社会的自动驾驶、移动娱乐和视频监控等等各个领域都有着广泛的应用。然而,基于深度学习的目标检测方法往往结构复杂,计算量庞大,难以在计算资源有限的嵌入式平台或者边缘移动端设备实现实时目标检测,轻量化网络设计旨在保持模型精度基础上近一步减少模型参数量和复杂度。本文以围绕YOLO系列网络进行了轻量化的改进优化设计,提出了适用于嵌入式平台或者边缘移动端设备的轻量型实时目标检测算法。

首先,针对无人机这种小目标检测场景,对原本YOLOv3三个特征尺度检测扩展到了五个特征尺度检测,充分利用了多个尺度特征的综合信息帮助提升模型的精度,使用轻量化网络GhostNetSandglass在骨干网络部分构建轻量级网络对特征提取进行加速,在生成的复杂城市背景下的无人机数据集上训练验证,在1080 Ti上测得其最高精度能够达到98.92% precision精度,实时速度具有62.37 FPS

其次,针对自然场景,面向PASCAL VOCMS COCO这样的数据集以YOLOv5s为基准模型,提出两种改进的轻量型实时目标检测方法,分别是Alpha-SGANetAlpha-EGBNetAlpha-SGANet主要包含了如下的改进方案:首先,综合考虑性价比,增加一个预测检测头检测不同尺度的目标,即增加一层下采样(P6)帮助增加感受野的同时也综合利用了多尺度信息,在骨干网络部分使用ShuffleNetV2构建了轻量且高效的特征提取网络,使用更小卷积核大小的SPP抑制信息丢失;然后,巧妙使用GAFPN在颈部部分帮助特征处理过渡,主要包含了Ghost模块生成有效的特征图帮助预测,并进一步集成了CBAM模块找到场景中感兴趣的区域;最后结合Alpha-IoU loss对模型监督训练获得了性能的最大提升。实验结果表明,我们提出的Alpha-SGANetPASCAL VOC数据集上精度具有65.14% mAP,相比于原本的YOLOv5s提升了7.52% mAP,实时速度具有68.49 FPS,在MS COCO数据集上精度具有39.73% mAP,实时速度具有74.6 FPS,为了更好的权衡目标检测中速度和精度问题,提出了一个小模型版本Alpha-SGAsNet,以2.84 MB的参数量在PASCAL VOC数据集上获得62.62% mAP,实时速度具有105.3 FPS,以3.01 MB 的参数量在MS COCO数据集上获得37.84% mAP,实时速度具有104.2 FPS。进一步通过在NVIDIA Jetson AGX 平台上验证,Alpha-SGANet具有19.46 FPS实时速度,Alpha-SGAsNet获得了24.23 FPS的实时速度,相比于YOLOv5s19.31 FPS还要高4.92 FPS,这样的结果能满足大多数场景在嵌入式平台上的实时性要求。

基于Alpha-SGANet的基础上,进一步尝试改进优化,提出了Alpha-EGBNet算法,主要包含了如下的改进方案:首先,使用ShuffleNetV2的改进版本ESNet作为骨干网络,在给网络提速的同时生成高效而丰富的特征图,在最后一层级特征图使用SPP帮助增加感受野;在颈部部分通过GA-BiFPN进行特征过渡处理,不同于Alpha-SGANet中使用四个特征尺度进行预测的方法,这儿是在三个特征尺度上结合了BiFPN的思想帮助多尺度特征信息融合,同时也同样使用到了Ghost 模块和CBAM模块有效提升了模型的性能;最后,结合Alpha-IoU loss帮助监督模型训练得到了更为准确的边界回归框。实验结果表明,Alpha-EGBNetCOCOVOC数据上都获得了比Alpha-SGANet更佳的表现,并且具有实时检测速度。

语种中文
源URL[http://ir.ioe.ac.cn/handle/181551/10300]  
专题光电技术研究所_光电技术研究所博硕士论文
推荐引用方式
GB/T 7714
李鸿. 基于轻量化网络的目标检测算法研究[D]. 中国科学院光电技术研究所. 中国科学院大学. 2022.

入库方式: OAI收割

来源:光电技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。