中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于多尺度特征提取与融合的视觉目标检测研究

文献类型:学位论文

作者李泽坤
答辩日期2022-05-22
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师胡卫明
关键词目标检测,尺度变化,多尺度特征提取,多尺度融合,多尺度全局信息融合
学位专业模式识别与智能系统
英文摘要

基于深度学习的目标检测任务一直是计算机视觉领域中最基本与最重要的
研究课题之一。该任务的目标是在给定输入图像样本及感兴趣类别的情况下,输
出图像样本中感兴趣物体类别的置信度分数,以及表示物体位置和大小的包围
框。在学术研究中,目标检测任务可以视为是其它高层视觉任务的基础课题,例
如目标跟踪、目标实例分割、行人检测、图像描述等,目标检测任务的研究与发
展在一定程度上都推动了高层视觉任务的研究与发展。在工业应用中,目标检测
任务可以为大量下游任务提供技术支持,例如智能安防、人脸识别、无人驾驶、
遥感监测等。因此,针对基于深度学习目标检测的研究与探索具有十分重要的学
术意义和应用价值。无论是学术研究还是实际应用,目标检测任务面对的输入数据通常来自于真实场景,但在真实场景中通常存在尺寸大小不同的物体,而物体的尺度变化问题是目标检测任务中极具挑战的问题之一。传统方法针对多尺度物体的识别不具有鲁棒性,很难兼顾不同尺度物体的检测性能。为了缓解目标检测任务中的尺度变化问题,以特征金字塔为代表的多尺度特征融合方法作为基本结构被广泛用于检测模型中。因此本文针对目标检测任务中的尺度变化问题,分别从多尺度特征提取与利用、多尺度特征融合以及多尺度特征学习三个方面进行了深入的研究与分析。
本文的主要成果和贡献可归纳如下:

提出了基于自适应由粗到细交互器的多尺度目标检测框架。以特征金字
塔为代表的多尺度特征融合方法中,多尺度特征信息存在提取不充分与利用率
低下等问题,会导致所构建的金字塔式结构多尺度表示能力较差。基于上述问
题,本文设计了一种基于自适应由粗到细粒度特征提取的多尺度交互器。相比于
以往的特征金字塔式解决方案,本文提出的多尺度交互器可以充分利用多尺度
特征相应的粗粒度特征用以补足不同分辨率特征的尺度信息,并通过提取多尺
度特征中的细粒度信息用以获取精确的物体空间信息,对于多尺度特征有效的
提取与利用使得所构建的金字塔式结构具有更强的多尺度表示能力。通过实验
验证与分析,本文所设计的多尺度交互器在检测及实例分割任务上性能均有明显提升,有效改善了多尺度特征提取过程,充分探索了多尺度的内在信息,缓解
了目标检测中的尺度变化问题。
• 提出了基于样本独立的动态多尺度融合目标检测框架。在面对不同尺度
物体的输入时,多尺度特征融合过程的固化性会导致不同层级特征的学习出现
偏差。基于上述问题,本文设计了一种基于样本独立的动态融合多尺度连接器。
相比于传统方法固化的特征融合机制,本文提出的动态连接器可以根据当前输
入动态地调整整个多尺度融合过程。首先所设计的动态连接器根据当前输入样
本,动态地为融合过程筛选合适的多尺度特征;其次在多尺度特征交互过程中,
动态地为融合过程选择出合适的多尺度特征交互路径。所设计的动态连接器可
以根据当前输入样本,动态且灵活地调整融合过程所需的多尺度特征及合适的
交互路径,针对不同尺度的物体可以实现分而治之的特征交互过程,有效改善了
多尺度特征融合模式。通过实验验证与分析,本文所设计的基于样本独立的动态
融合多尺度连接器可以明显改善不同尺度物体的检测性能。
• 提出了基于语义感知解耦Transformer 金字塔的密集预测框架。针对多尺
度特征不能有效学习全局信息的问题,本文设计了一种基于语义感知解耦Transformer
金字塔模型。Transformer 可以有效帮助特征学习长距全局信息,因此基
于所设计的语义感知机制可以充分探索特征全局语义信息多样性。此外通过提
出的跨尺度解耦交互策略,可以有效促进不同层级间特征的交互学习,使得跨尺
度特征在学习自身全局信息的同时,可以获取其它层特征的全局信息,以此增
强当前层级特征的多尺度表示能力及全局信息感知能力。通过实验验证与分析,
本文所提出的基于语义感知解耦Transformer 金字塔模型可以有效缓解密集预测
任务中的尺度变化问题,并在多个密集预测任务如目标检测、语义分割等任务上
均取得了较优的实验结果。

语种中文
页码140
源URL[http://ir.ia.ac.cn/handle/173211/48828]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
李泽坤. 基于多尺度特征提取与融合的视觉目标检测研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。