基于深度学习的目标检测方法轻量化研究
文献类型:学位论文
作者 | 杨锦辉 |
答辩日期 | 2022-05-27 |
文献子类 | 硕士 |
授予单位 | 中国科学院光电技术研究所 |
授予地点 | 中国科学院光电技术研究所 |
关键词 | 深度学习,轻量化目标检测,特征融合,感受野 |
英文摘要 | 在过去的几年里,与传统的计算机视觉算法相比,深度学习在各种计算机视觉应用中已经显示出更优的效果,深度学习模型在准确性和处理时间方面都表现出色,因此基于深度学习的目标检测算法已渐渐超越传统的检测技术,并且随着海量标注图像测试数据集的出现,以及计算硬件的突破,如更强大的GPU(图形处理单元)、CPU(中央处理单元)和更好的计算程序(库和框架),基于深度学习的检测模型在复杂测试数据集上取得了越来越高的准确性。但这些检测模型为了追求高准确精度,网络结构越来越复杂,参数量和计算量过大,难以满足低功耗的嵌入式设备和移动设备的使用,如智能手机,视频实时监控设备等。为了解决该问题,本文从轻量化目标检测模型的网络结构、感受野增强、特征融合等方面展开深入研究,主要研究内容分为以下两个部分: (1)提出了一种感受野增强和卷积轻量化的检测算法(RFBG-YOLO)。针对YOLO系列最新的轻量化目标检测算法YOLOv5s的PANET特征融合中的Bottleneck结构感受野太小,特征提取不足,从而影响了检测精度的问题。本文提出了多分支空洞卷积结构RFB-Bottleneck,来替换PANET的Bottleneck结构,优化后的特征融合方式RFB-PANET,可以通过更少的参数量获得更大的感受野,这有利于提升轻量化检测模型的检测精度。针对优化后的特征融合方式RFB-PANET虽然提高了检测精度,但结构也变得更加复杂,因此引入了GhostConv替换常规卷积,通过减少常规卷积的冗余计算来弥补RFB-PANET计算成本增加的缺点,提高了检测速度,降低了计算量。 (2)提出了一种浅网络和窄通道的多重双向融合轻量化目标检测算法(Multi-TF YOLO),针对目标检测网络YOLOv3参数量和计算量过大,难以满足低功耗的嵌入式设备和移动设备完成实时检测任务,本文对YOLOv3的网络部分做了压缩,以提升模型的推理速度,大幅减少参数量。针对YOLOv3采用的FPN特征融合获取到的深层特征图的分辨率小,位置信息不足,减弱了大物体的检测能力的问题,本文提出了Multi-TF多重双向特征融合方式,该融合方式增加了自下而上的融合路径,实现了浅层特征图利用深层特征图的位置信息,并且将此双向特征融合方式作为基本特征融合单元在Neck部分多次使用,显著提升了网络的检测效果。 |
语种 | 中文 |
源URL | [http://ir.ioe.ac.cn/handle/181551/10316] ![]() |
专题 | 光电技术研究所_光电技术研究所博硕士论文 |
推荐引用方式 GB/T 7714 | 杨锦辉. 基于深度学习的目标检测方法轻量化研究[D]. 中国科学院光电技术研究所. 中国科学院光电技术研究所. 2022. |
入库方式: OAI收割
来源:光电技术研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。