中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向水下开放环境的视觉目标检测方法研究

文献类型:学位论文

作者武志亨
答辩日期2023-05-23
文献子类硕士
关键词水下视觉感知 水下图像合成 开放世界目标检测 迁移学习
英文摘要

随着全球对海洋发展的重视日益增强,各国政府制定了一系列政策以平衡环境保护与经济发展。水下机器人作为一种具有广泛应用前景的高科技装备,在海洋科学研究、资源开发、环境监测等领域发挥着重要的战略作用。大多数水下作业需要水下机器人具备感知周围环境的能力。近年来,深度学习方法在计算机视觉领域取得了显著成果,为水下视觉感知的发展提供了契机。但由于水下图像数据获取困难,导致依赖大量训练数据的基于深度学习的视觉感知技术在水下的应用面临着巨大的挑战。因此,基于有限数据的水下视觉感知方法研究,对于实现机器人自主水下勘探具有重要意义。

本文聚焦于水下图像稀缺情况下的视觉感知问题,旨在提高目标检测算法在水下开放环境的感知性能。目标检测是一种依赖大量训练数据的计算机视觉技术。然而,在水下环境中,获取大量高质量的训练数据十分困难,使得目标检测算法在水下视觉任务中的表现受到很大限制,而水下数据的稀缺导致可用于诱导检测器识别的水下类别较少,进一步影响了水下目标检测识别的性能。针对上述问题,本文围绕水下数据扩充、水下类别扩充和改善目标检测性能展开研究,主要的研究成果如下:

(1)针对水下数据集缺乏的问题,提出了一种基于像素级自监督学习的水下图像合成方法SUG。首先,构建了水下图像合成模型,将水下视觉形成过程中的衰减、散射和相机模型等物理原理作为知识驱动,通过模拟光信号的变化将陆地图像转化为水下风格。其次,设计了一种像素级自监督训练策略,通过像素级损失函数监督图像各位置光信号的变化,实现了高质量水下图像的合成。该策略仅需水下图像即可完成训练,无需额外输入,从而有利于训练数据的收集。最后,在不同风格水下数据集上的实验表明,SUG方法能够合成适用于不同水下环境和光照条件的水下图像。此外,将SUG方法应用于陆地图像测试,也取得了令人满意的效果。

(2)针对水下数据集稀缺导致的检测类别有限的问题,本文提出了未知类可分的开放世界目标检测问题UC-OWOD,旨在检测未知物体并将其分类为不同的未知类别。为了解决UC-OWOD问题,提出了一种两阶段目标检测器UC-Det。首先,设计未知标签感知候选框ULP及未知判别分类头UCH模块来检测已知与未知物体。其次,构建基于相似度的未知分类SUC与未知聚类细化UCR模块,以区分多个未知类别。此外,设计了两种新的评估指标UC-mAP和UC-Recall,以评估未知物体检测性能。最后,大量陆地公开数据集实验证明了所提方法的有效性。此外,UC-Det仅用陆地数据集训练便能成功检测出水下自建数据集上的物体,并识别为不同未知物体。

(3)针对大多数视觉感知算法在水下视觉任务中因缺乏水下数据集而受限的问题,提出了一种基于水下合成数据增强的水下域预训练方法UDP。首先,从迁移学习角度对问题形式化定义,通过分析开放世界目标检测任务,得出将源域数据转换为目标域分布能提高开放任务性能的结论。其次,基于上述分析,提出了一种水下域预训练方案,利用SUG得到转换后的水下合成图像预训练模型,通过少量真实水下数据微调模型获得检测水下物体类别的能力。最后,在多种水下风格、多种水下视觉感知任务上对所提方法进行了验证,结果表明,UDP在水下UC-OWOD任务中对已知物体和未知物体的检测性能分别提高了21.26\%~mAP和4.97\%~UC-Recall;增量学习之后的灾难性遗忘也被大大缓解,旧类别的检测性能提升了11.86\%~mAP。

(4)为了验证所提理论方法的实际环境下的应用效果,本文设计并验证了面向水下开放环境的视觉感知系统。首先,融合SUG、UC-Det和UDP,构建了水下视觉感知系统。其次,以搭载视觉感知系统的微型计算机和水下航行器作为验证平台,在真实水域环境中展开了目标检测的实验。最后,实验结果显示,所提水下视觉感知系统能在水下机器人探索过程中定位并区分真实水下开放环境中的未知物体,并具备增量学习这些未知类别的能力。

语种中文
页码94
源URL[http://ir.ia.ac.cn/handle/173211/52175]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
武志亨. 面向水下开放环境的视觉目标检测方法研究[D]. 2023.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。