中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
视频行人再识别中集合表示与度量学习研究

文献类型:学位论文

作者卢宇衡
答辩日期2017-05-26
文献子类硕士
授予单位中国科学院大学
授予地点北京
导师王瑞平
关键词行人再识别 特征提取 图像集合 度量学习
学位专业其它专业
其他题名Image Set Representation and Metric Learning for Video-based Person Re-identification
英文摘要随着公共安全领域在世界范围内的受重视程度的快速提升,由监控摄像头组成的大规模监控网络的布置也越来越普遍。为了更好地匹配在不同时间出现于不同摄像机的同一身份行人,本文针对以图像集合对行人对象进行表示的视频行人再识别问题进行了广泛的调研整理和多路线的系统性研究。 这个问题分三个阶段展开:(1)单一行人图像的具鲁棒性与判别力的特征提取;(2)图像集合内多帧图像特征的稳定有效融合;(3)针对所设计的集合表示的判别性度量学习。前两个阶段被统称为集合表示。本文针对这三个阶段分别进行了详细的分析、整理和讨论,并针对于不同大小的图像集合,沿着两条不同的方法路线,从以上三个方面均进行了创新性的研究。 本文的第一个主要工作是针对较小规模的图像集合的以对称正定矩阵作为图像局部描述子的黎曼流形上的判别学习框架。该框架利用表征统一、刻画性强、表示稳定的区域协方差矩阵和区域高斯矩阵对行人图像局部区域进行特征表示,然后采用噪声鲁棒、兼容性好、方便易得、应用广泛的取平均法对多帧图像的特征表示在黎曼流形上进行融合,接着在流形上改进了两种具有代表性的判别学习方法,增强了框架的判别性能。这套框架在各个组件上都有着非常强的灵活性,并且在五个公开视频数据集上取得非常好的识别效果。 第二个主要工作是适用于多种规模图像集合的对图像局部平移和集合噪声鲁棒的端到端深度度量学习框架。考虑到深度网络在视觉任务上的出色表现,方法采用改进的深度网络框架对图像特征进行有效提取,提出的水平隔步池化法使得行人图像的深度特征对普遍存在的局部表观的水平平移鲁棒。针对行人视频片段中常常存在一些野值样本的问题,方法提出了收缩最近点模型,通过将仿射包/凸包的外包结构向集合中心方向收缩有效地滤掉了野值点,对集合进行了噪声鲁棒的建模。最后,该框架以集合三元组的形式端到端地对模型进行集合的深度度量学习,在三个公开视频数据集上取得了优秀的性能。 最后,本文还实现了一个一体化的视频行人再识别演示系统,将视频行人再识别的过程和结果一目了然地展示出来。同时也结合实例对视频行人再识别所带来的优势和仍面临的挑战进行了丰富的展示和深入的分析,并以此为契机对该领域将来可能的研究方向进行了探讨与展望。
学科主题 模式识别
语种中文
公开日期2017-07-03
源URL[http://ictir.ict.ac.cn/handle/311040/2724]  
专题中国科学院计算技术研究所学位论文_2017硕士
推荐引用方式
GB/T 7714
卢宇衡. 视频行人再识别中集合表示与度量学习研究[D]. 北京. 中国科学院大学. 2017.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。