基于深度学习的多行人目标跟踪及行人重识别算法研究
文献类型:学位论文
作者 | 刘金文 |
答辩日期 | 2021-05-21 |
授予单位 | 中国科学院沈阳自动化研究所 |
授予地点 | 沈阳 |
导师 | 田建东 |
关键词 | 多行人目标跟踪 人群密度图 行人重识别 注意力机制 深度学习 |
学位名称 | 硕士 |
学位专业 | 模式识别与智能系统 |
其他题名 | Deep Learning based Multi-person Tracking and Person Re-identification |
英文摘要 | 多行人目标跟踪及行人重识别作为计算机视觉领域的两个重要分支,有着广阔的应用前景和重要的应用价值,并且二者都是以人为研究对象,面临的挑战和难题有一定的相似之处。近年来,随着深度学习的发展,多行人目标跟踪及行人重识别研究取得了一定的进展,但是,行人姿态多变以及行人遮挡等问题仍然是目前所面临的技术难题和挑战。针对上述问题,本文在多行人目标跟踪研究中提出了一种融合人群密度的自适应深度多目标跟踪算法;在行人重识别研究中提出了一种融合注意力机制的行人重识别网络模型。本学位论文的主要研究内容和创新点如下:(1)提出了一种新的多目标跟踪算法。本文算法首先对人群密度图和目标检测结果进行融合,利用人群密度图的位置和计数信息对检测器输出结果进行修正,有效地消除了漏检和误检,可得到更加精确的检测结果;然后使用自适应Triplet Loss改进行人重识别模型的损失函数,提高了重识别特征的辨别能力,提升了跟踪器的数据关联精度;最后,使用行人表观和运动信息进行数据关联,得到最终的跟踪结果。实验验证了本文所提出的多目标跟踪算法能够有效地解决目标遮挡场景下的多目标跟踪问题。(2)提出了一种新的行人重识别网络模型。本文模型融合了注意力机制以增强网络获得行人空间信息的能力,所设计的注意力模块包含了空间注意模块和通道注意模块,使得注意力模块可以筛选出值得关注的特征。在本文模型中,选择了ResNet-101作为行人重识别模型的主干网络。为了网络提取的特征包含丰富的空间信息和语义信息,本文在主干网络的不同输出阶段构建了分支结构。为了网络提取的行人特征更具判别性,本文使用ID分类损失和度量学习方法同时对网络进行训练。对于注意力模块的最佳融合方式,本文进行了分析并确定了最佳融合方式。实验结果表明本文提出的行人重识别模型可以提取判别性行人特征,具有良好的性能。 |
语种 | 中文 |
产权排序 | 1 |
页码 | 63页 |
源URL | [http://ir.sia.cn/handle/173321/28952] ![]() |
专题 | 沈阳自动化研究所_机器人学研究室 |
作者单位 | 中国科学院沈阳自动化研究所 |
推荐引用方式 GB/T 7714 | 刘金文. 基于深度学习的多行人目标跟踪及行人重识别算法研究[D]. 沈阳. 中国科学院沈阳自动化研究所. 2021. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。