中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度学习的红外场景目标检测

文献类型:学位论文

作者秦鹏
答辩日期2022-05-20
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院光电技术研究所
导师刘云峰
关键词红外目标检测 特征提取 Yolo 嵌入式部署
学位名称工程硕士
其他题名Object Detection in Infrared Scenes Based on Deep Learning
英文摘要

红外成像系统以其全天时的特点而被广泛应用于智能驾驶、红外侦察、环境监测等诸多领域。随着GPU算力的提升和大型标注数据集的出现,使用深度学习的方法对红外目标检测进行研究具有重要意义。然而红外图像因其波长较长导致目标的轮廓边缘模糊,特征细节不明显,缺乏颜色信息,与可见光图像相比检测难度更大。事实上,尽管随着深度学习网络的飞速发展,红外目标检测已取得了很大进步,但仍存在以下问题:(1)现有的卷积激活结构在提取特征时缺乏灵活性,编码容量受限;(2)卷积神经网络主要对局部像素建模,未考虑全局像素之间的特征关系;(3)未充分利用红外目标相对背景存在的显著性,缺少位置信息注意力;(4)嵌入式平台部署时,网络推理速度较慢,不能达到实时检测。鉴此,本文开展了如下研究工作:

1)针对红外目标特征信息较少,普通的卷积网络结构特征提取能力欠佳等问题,本文在YOLOv3的基础上设计了Effi-YOLO 网络。该网络以动态卷积激活结构灵活地根据输入特征调整卷积计算区域及权重系数,并根据计算结果采用与之适应的激活率。采用轻量高效的骨干网络进行基础特征提取,并使用具有显著性增强的感受野模块扩大模型感受野,建立新的目标位置损失函数,提升模型目标回归定位准确度。在FLIR数据集上进行测试,新模型相对基线算法YOLOv3模型大小缩减为33.3%,检测mAP提升了9.9%

2)针对卷积神经网络只对局部像素建模,缺乏像素点之间的长程依赖信息,未充分利用显著性信息等问题,设计了DINet网络模型。DINet结合了Transformer的全局信息和卷积神经网络的局部信息,强化了特征提取和建模能力。图像输入阶段利用显著性预测网络生成了具有显著性目标信息的伪彩色图像。构建了新的感受野增强模块,在扩大模型感受野同时,增强目标区域内部显著性信息,并通过多层特征层融合结构进一步提升红外目标检测性能。在FLIR数据集上检测精度比YOLOv5-S提升5.5%;在KIAST数据集上漏检率比IATDNN+IASS4.11%

3)为了满足实际工程项目需要,构建了一个红外无人机数据集用于网络模型的训练与验证。选择轻量化的YOLOv5-S网络,在PC端训练好之后对TX2平台进行移植。为了进一步加快模型推理速度,在TX2上采用TensorRT加速技术对移植的YOLOv5-S进行浮点计算优化和模型结构融合,成倍提升模型推理速度,最终推理速度达到58/秒,满足实时检测要求。

综上,本文的研究通过高效的特征提取、自适应的动态卷积激活结构、双模态图像的特征增强有效提升了目标检测能力和红外系统的目标检测性能,在公开数据集及自建数据集上进行验证,结果表明算法相对基线算法有明显提升。

语种中文
源URL[http://ir.ioe.ac.cn/handle/181551/10298]  
专题光电技术研究所_光电技术研究所博硕士论文
推荐引用方式
GB/T 7714
秦鹏. 基于深度学习的红外场景目标检测[D]. 中国科学院光电技术研究所. 中国科学院大学. 2022.

入库方式: OAI收割

来源:光电技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。