视觉场景中的行人表征与识别
文献类型:学位论文
作者 | 罗传琛![]() |
答辩日期 | 2023-05-20 |
文献子类 | 博士 |
关键词 | 行人重识别 表征学习 特征聚合 领域自适应 虚拟数据合成 |
英文摘要 | 随着智慧城市进程的稳步推进,部署于各场所的监控摄像头规模迅速扩大。在此背景下,使用人工进行监控视频数据的检索和处理是不切实际的,如何利用计算机视觉技术实现自动化的监控成为研究的重点。行人重识别作为视频智能监控的关键组成部分得到了学术界和工业界的广泛关注,它旨在多个不重叠的相机视角下检索出和给定查询图片属于同一行人的其他图片。行人重识别的关键在于学习一个类内足够紧致、类间足够分散的特征空间。然而,相机视角、人体姿态、环境光照和拍摄背景的剧烈变化可能会使得同一个人的图片有着显著不同的视觉外观,这对模型的判别能力提出了极大的挑战。此外,对标注数据的严重依赖也限制了行人重识别模型在真实场景中的部署。为克服这些困难,本文从三个方面探讨如何提升行人重识别的判别性和泛化性。 总而言之,本文的研究重点在于解决行人重识别的类内差异和泛化性问题。 |
语种 | 中文 |
页码 | 114 |
源URL | [http://ir.ia.ac.cn/handle/173211/51908] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 罗传琛. 视觉场景中的行人表征与识别[D]. 2023. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。