中国科学院机构知识库网格系统: 行人分割与识别研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

行人分割与识别研究

文献类型：学位论文


作者	宋纯锋
答辩日期	2019-12
文献子类	博士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	王亮
关键词	行人图像分割，行人识别，步态识别，弱监督学习
学位名称	工学博士
学位专业	模式识别与智能系统
英文摘要	随着国家和社会对于大范围智能视频分析和个体身份识别技术日益增长的需求，远距离身份识别技术的研究吸引了众多研究者。当前，常用的身份识别技术主要有指纹识别、人脸识别、虹膜识别等。这些技术由于具有较高的识别准确率在金融身份验证、人机交互、门禁打卡等任务上得到大规模的应用。这些技术都需要识别对象的主动配合，并且通常对于识别距离、识别视角、识别环境等都有较为严格的限制，因此它们难以实现在较远距离、任意姿态、任意视角、非配合情况下的行人身份识别。对于这些问题，本文提出的基于行人图像分割与行人身份识别算法提供了解决思路，研究了弱监督情况下的图像分割以及基于行人图像分割的行人识别等关键问题。本文的研究注重行人识别方法的实际使用场景，在数据供应难度、算法效率、环境多样性等方面都予以考量，设计并研发了可在实际监控环境应用的行人识别方案。本文针对以下问题展开具体研究 (1)考虑到图像分割模型对于标注数据的依赖，在数据受限的条件下，探索了弱监督行人图像分割解决方案。行人图像分割在全卷积分割网络的帮助下取得了一系列的进展。这些全卷积分割模型通常依赖于代价高昂且耗时的像素级别的人工标注数据来训练而使得其无法快速部署。为了解决这一问题，通过弱监督的方式利用廉价的检测框来指导分割学习是一个不错的选择。本文首先提出利用检测框来构建类别敏感的目标蒙板来滤除与该类别无关的背景，这种方式可以帮助后续的弱监督分割学习。在此基础上，本文发现每个类别的检测框中前景目标的像素填充率具有统计规律上的一致性，并将其作为一个先验信息来指导分割模型动态选择最具有置信度的区域。本文提出的方法在PASCAL VOC 2012数据集上的大量实验表明，该方法是有效的并取得了当前最优的性能。通过这种方法，可达到在数据受限场景下的接近全监督模型的行人图像分割性能。 (2)为了减少背景噪声对于行人识别的影响，研究了基于行人分割的行人再识别方法。行人再识别问题是一个具有挑战性的经典计算机视觉任务。通常摄像头采集到的行人图像中含有杂乱的背景，并且图像中的行人通常有多种多样的姿态和视角，这些多样性造成的困难在之前的研究中都尚未得到很好的解决。本文引进了二值化的行人分割轮廓图作为额外输入，并与彩色图像合成为四通道的新输入，然后设计了一种基于分割轮廓图的对比注意模型来学习背景无关的行人特征。在此基础上，本文提出了一种区域级别的三元组损失函数，分别来约束来自全图区域、行人身体区域、背景区域的特征，最终达到去除背景的作用。所提出的方法在MARS，Market-1501以及CUHK03等三个行人再识别数据集上验证了有效性，取得了当前最好的性能。 (3) 结合成熟的行人分割方法，提出一种步态分割与识别一体化方法。考虑到当前步态识别方法通常包括图像分割、步态模板生成、特征提取以及度量学习等多个人工设置的步骤。一方面，这些硬性的操作过程中可能会导致一些有益特征的丢失，比如步态中的纹理、时序等信息；另一方面，这一系列的步骤包含了一些冗余的信息，以及由于中间步骤误差导致的累积误差。因此，需要一种自动的精确设计的端到端学习的框架，从原始步态图像学习步态特征。本文提出一种基于卷积神经网络的步态分割与识别一体化模型，其中步态分割包含多个通道，每个通道负责分割一帧步态图像；这些通道的输出直接作为步态识别的输入，最终识别与分割两个约束同时作用于整个模型。所提出的方法在三个步态数据库（包括CASIA-B、SZU RGB-D以及新建立的Outdoor-Gait）上的步态识别性能优于目前主流的步态识别方法，验证了其有效性。
语种	中文
页码	124
源URL	[http://ir.ia.ac.cn/handle/173211/28371]
专题	毕业生_博士学位论文
推荐引用方式 GB/T 7714	宋纯锋. 行人分割与识别研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2019.

入库方式： OAI收割

来源：自动化研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。