中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度学习的视频目标检测方法研究

文献类型:学位论文

作者蒋正锴
答辩日期2020-05-29
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师向世明
关键词深度学习 视频目标检测 时空特征对齐 时空像素采样
学位专业模式识别与智能系统
英文摘要

目标检测是计算机视觉的一个重要研究方向,被广泛应用于视频监控、人脸检测以及自动驾驶等领域。近年来,基于深度学习的图像目标检测取得了巨大的成功。然而,由于视频中存在运动模糊、部分遮挡以及复杂的姿态等问题,逐帧
地进行图像目标检测很难解决这些问题。视频中包含丰富的时序信息。当前,在
深度学习的框架下,基于时序信息的视频目标检测是计算机视觉中的一个研究热点。面向视频目标检测任务,本文开展时空深度学习模型构建与优化的研究工
作,充分利用视频中的时空信息来提高视频目标检测精度和速度。论文的主要贡
献如下:
1. 提出一种基于局部加权可变邻域时空特征对齐的视频目标检测方法。首
先,基于脑启发的特征记忆机制,通过在关键帧与关键帧之间传播和更新记忆
特征来增强关键帧的特征鉴别能力;然后,利用局部加权可变邻域操作将关键
帧特征在空间和时间轴上同时对齐到非关键帧,增强非关键帧的特征学习能力。
在此过程中,进一步利用关键帧和非关键帧的低层级特征来学习局部区域的相
似性权重和目标移动偏移量,并基于加权目标移动偏移量来最终实现运动目标
的时空对齐。基于上述所提时空信息传播方法,论文构建了一个基于局部加权可
变邻域时空特征对齐的视频目标检测深度学习模型。对比基于光流网络的特征
传播方法,所提方法在提升视频目标检测精度的同时降低了深层神经网络模型
的参数总量。
2. 提出一种基于时空采样特征对齐的视频目标检测方法。首先,基于关键
帧像素时空采样,对关键帧与非关键帧对应像素的特征相似度进行估计,并利用
该相似度对关键帧相应空间位置的特征进行线性加权;然后,在极小化目标检测
损失函数的监督下,对采样点位置进行优化与更新,通过高层特征在不同帧间的
传播来实现加权特征在空间和时间轴上的时空对齐。在此过程中,进一步引入关
键帧稀疏递归特征更新策略和非关键帧稠密特征聚合策略来提升关键帧和非关
键性的特征表达能力,从而实现高精度的特征时空对齐。基于上述所提方法,论
文构建了一个时空采样特征对齐的视频目标检测深度学习模型。在视频目标检
测的基准数据集ImageNet VID 上的对比实验验证了所提方法的有效性。

语种中文
页码74
源URL[http://ir.ia.ac.cn/handle/173211/39268]  
专题自动化研究所_模式识别国家重点实验室_遥感图像处理团队
通讯作者蒋正锴
推荐引用方式
GB/T 7714
蒋正锴. 基于深度学习的视频目标检测方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。