基于姿态信息的行人重识别
文献类型:学位论文
作者 | 贾力榜![]() |
答辩日期 | 2021-05-28 |
文献子类 | 硕士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院自动化研究所 |
导师 | 彭思龙 |
关键词 | 卷积神经网络 姿态估计 注意力机制 行人重识别 数据增广 |
学位专业 | 计算机科学与技术 |
英文摘要 | 随着人工智能技术的迅速发展,智能化视频监控技术成为城市安全防范体系的重要一环。近年来,人脸识别技术愈发成熟,被广泛用于各类监控系统中进行行人身份核对。然后现实场景的视频监控系统无法保证在各类复杂环境下拍摄到清晰的人脸图像。因此,利用全身信息进行行人身份核对与识别变得尤为重要。行人重识别,是一种利用计算机视觉方法搜寻不同摄像头下特定行人的技术,在智慧城市等视频监控场景中具有重要的意义。作为智能视频分析的研究热点,许多科研人员在行人重识别领域辛苦耕耘,取得了丰硕的研究成果。但在实际应用场景中,受摄像机参数,行人遮挡,光照以及姿态差异等因素的影响,同一目标在不同摄像头下视觉差异大,识别准确率较低。因此,本文重点研究跨视角场景下如何获取身份相关,姿态无关的高鲁棒性行人特征。本文采用姿态引导行人对齐的方法进行行人重识别,引入压缩-激励模块和聚合转换神经网络,提升行人重识别网络特征抽取能力,有效的降低了姿态差异对识别精度的影响。本文的具体内容与创新点如下: (1)提出了一种基于压缩-激励注意力模块的行人重识别方法。为了提取身份相关,姿态无关的行人特征,本文使用基于姿态引导的重识别基准网络,实现行人身份的自动高精度识别。考虑到基准模型的骨干网络ResNet50针对特定信息抽取能力较弱,我们引入压缩-激励注意力模块,重点学习与行人身份相关的信息,抑制无关信息。压缩-激励注意力模块可以建立特征通道间的联系,从而自适应的从全局信息出发,学习和身份识别相关性更高的特征表示。我们在三个公开数据集Market-1501、DukeMTMC-reID和CUHK03上进行了对比实验,实验结果表明top-1准确率至少提升0.7个百分点,mAP 准确度至少提升1.0个百分点,证明了该模型的有效性。 (2)提出一种基于聚合转换和卷积块注意力模块的行人重识别方法。本文使用姿态归一化网络作为基准网络,通过生成8个标准姿态图来扩充原始数据集,进一步提升行人重识别模型的鲁棒性与识别精度。我们首先将原始模型的ResNet50结构全部替换为聚合转换深度神经网络,然后引入轻量化的卷积块注意力模块。聚合转换深度神经网络结合了VGG网络的堆叠思想和Inception网络的分离-转换-聚合策略,在不增加网络深度和宽度的同时提升了行人重识别准确率。为了验证模型的有效性,在Market-1501、DukeMTMC-reID和CUHK03数据集上进行对比实验,结果表明改进后的ResNeXt50注意力网络,有助于提升模型的鲁棒性,表现出更好的识别精度。 |
语种 | 中文 |
页码 | 58 |
源URL | [http://ir.ia.ac.cn/handle/173211/45054] ![]() |
专题 | 自动化研究所_智能制造技术与系统研究中心_多维数据分析团队 |
推荐引用方式 GB/T 7714 | 贾力榜. 基于姿态信息的行人重识别[D]. 中国科学院自动化研究所. 中国科学院大学. 2021. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。