中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
复杂场景下运动目标跟踪技术研究

文献类型:学位论文

作者邹卓君
答辩日期2023-05
文献子类博士
关键词视觉跟踪 注意力机制 孪生网络 模糊目标跟踪 形变目标跟踪 抗干扰跟踪
英文摘要

      随着互联网技术的发展和拍摄设备的普及,基于视频流的信息传递模式在近几年发展迅速。在该背景下,各行业对视频序列中的运动物体进行持续跟踪的需求急剧上升。目标跟踪技术在人机交互、智能视频监控、智能驾驶和军事侦察任务中起着至关重要的作用。设计准确且稳定的跟踪方法不仅能提升智能设备的使用体验,对保障公共安全和社会安定也有重大意义。因此,目标跟踪技术的研究具有重要的学术价值和应用价值。

      近年来,基于孪生神经网络的目标跟踪方法取得了巨大的成功,在保证运行实时性的前提下,跟踪性能相较于相关滤波器方法得到大幅提升。然而在实际应用中,拍摄条件差、目标主体形态变化以及背景环境干扰等复杂的场景因素依然给跟踪方法的设计带来巨大挑战。因此,本文针对复杂场景下运动目标跟踪的难点展开研究,分别在运动模糊、目标大幅形变、以及邻域背景干扰三个场景下提出跟踪方法,具体包括以下内容:

      1. 提出基于运动语义增强的模糊目标跟踪方法。运动模糊引起的目标分辨率降低和边沿模糊会使外观特征质量急剧下降,从而导致传统相似性匹配方法难以鲁棒地定位该类物体。针对该问题,本文提出了双流跟踪网络。该网络通过提取相对运动语义和进行特征互相关来鲁棒地跟踪模糊目标。此外,为了使相对运动始终为目标对地运动,本文为上述网络设计了启发式参考帧选择策略以增强方法的泛化性。该方法在不影响跟踪速度的前提下,通过分析场景中运动区域来协助相似性度量方法精确定位模糊目标。本文提出的目标跟踪网络在多个运动模糊场景跟踪数据集上取得了领先的定位精度。此外,衍生的孪生变化物体检测方法在主流变化检测数据集上也取得了同时期领先的成绩。

      2. 提出基于多形态表征学习的形变目标跟踪方法。当目标发生显著形变时,基于手工特征的跟踪方法难以鲁棒地判断相似性,基于卷积神经网络的方法虽然可以依靠监督学习提供先验来定位多形态目标,但难以从数据中学习非刚性形变目标的非线性多形态变化。 针对该问题,本文提出了在线多形态表征跟踪方法,根据目标变化情况,实时地为基于注意力机制相似性匹配的孪生网络动态增加多形态特征。为了进一步过滤多形态冗余特征,本文采用单遍聚类方法,在在线跟踪阶段对分类网络得到的高置信度特征进行动态稀疏采样。该方法能实时更新目标的表征向量,并能够平衡跟踪速度和定位精度。在目标刚性形变和非刚性形变的多个数据集上的实验表明,所提出的跟踪方法具有实时的运行速度,并且相较同类方法在目标发生显著形变时具有更高的定位精度。

      3. 提出基于局部抑制和全局匹配的抗邻域干扰跟踪方法。当目标邻域的背景纹理和色彩与目标趋于一致,或邻域内有和目标高度相似的物体时,传统的局部图像匹配跟踪方法的定位精度将大幅下降。针对该问题,本文首先面向单一物体标注的跟踪场景提出了一种缓解局部有偏先验负面影响的跟踪方法,并为目标提供多候选定位,以减少邻域干扰造成的模型对目标整体性认知偏差现象。同时,本文面向检测模型提供多物体标注的跟踪场景,提出了一种利用多目标全局完备匹配进行历史轨迹与检测结果关联的跟踪方法,并利用多源特征分别构建在高速应用场景和高精度应用场景下的权重矩阵。实验结果表明,本文提出的局部有偏先验抑制跟踪方法在邻域背景干扰场景中具有领先的精度和实时运行速度。另外,在物体密集的多目标数据集上的实验表明,本文提出的全局完备匹配跟踪方法相较于同类方法具有更低的目标丢失率,且装配该方法的无人机集群视觉跟踪效果稳定。

语种中文
页码135
源URL[http://ir.ia.ac.cn/handle/173211/52262]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
邹卓君. 复杂场景下运动目标跟踪技术研究[D]. 2023.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。