中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向人体动作识别的自监督学习方法研究

文献类型:学位论文

作者高浩元
答辩日期2022-05-20
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院大学
导师张一帆
关键词动作识别 骨骼关键点 自监督学习 表征学习
学位名称工学硕士
学位专业模式识别与智能系统
英文摘要

人体动作识别在视频监控、医疗看护、虚拟现实与人机交互等方面有着广泛的应用。随着近年来基于深度学习的骨骼关键点检测技术日趋成熟,基于骨骼关键点的动作识别方法正受到越来越多的关注。然而,有标签的骨骼关键点数据集获取难度较高,除了标注成本高昂的问题外,标注中存在的动作行为类型较多、分类较为主观等因素,也使得其有标签数据的获取难度远大于无标签数据。因此,开展面向人体动作识别的自监督学习方法研究具有重要的理论意义和应用价值。

近年来,随着真实应用场景中数据的积累量越来越大,自监督学习的重要性也日益凸显。与深度学习中的有监督学习范式不同,自监督学习范式允许我们挖掘出海量无标签数据中的信息和价值,即设计一个无需标签的自监督代理任务,使模型学习如何解决这个任务,之后将训练完成得到的模型迁移到下游任务上进行应用。这样的方式大大提升了数据利用率,且显著降低了标注成本。

本文围绕如何设计有效的面向人体动作识别的自监督学习方法展开,首先调研了已有自监督学习方法的效果,并将基于对比和基于聚类的自监督学习方法相结合,提出基于原型对比学习的行为表征方法,使学习到的表征能同时描述数据变换中的语义不变性和类别层面的语义一致性;之后根据对自监督对比学习的进一步理论分析,提出一种自监督学习框架,该框架可根据先验知识对表征向量的分布选取不同的假设,以获得不同的自监督学习过程,并证明了对比学习是该框架的一种特殊情况。

论文的主要工作和创新点归纳如下:
1.提出基于原型对比学习的行为表征方法:已有的工作通过引入一个离线聚类过程将基于聚类的方法与基于对比的方法相结合,然而该过程需要收集整个训练集的全部表征向量来进行,既不支持在线学习又需要耗费大量的时间。
针对这个问题,本文提出一种自监督学习方法,在对比学习的基础上,通过在超球面上均匀采样一组原型向量,之后使每个表征向量靠近与自己最接近的原型向量并远离其他原型向量的方式来构建一个“原型损失函数”,将该损失函数与传统的对比损失函数相结合得到“原型对比损失函数”,并以端到端的方式通过梯度下降联合优化编码器网络与原型向量组的参数。该方法在无需离线聚类的情况下,使表征向量具有描述出数据变换过程中语义不变性的能力,同时使学习到的表征具备类别层面的语义一致性和空间上的分布均匀性。该方法学习得到的表征向量应用于动作识别下游任务中的性能相比于已有方法有显著提升。
2.提出一种基于受限条件互信息的自监督学习框架:基于对比的自监督学习方法通过构建InfoNCE损失函数使学习到的表征向量能描述数据变换中的语义不变性,在表征学习中达到了显著的效果。然而,这些方法无法将对表征向量先验分布的假设引入训练过程中。针对该问题,本文通过对对比学习内在作用机理的分析,提出了一套自监督学习框架,即在对表征先验分布的约束下,最小化表征向量和增强样本之间在已知原始样本时的条件互信息,并证明了对比学习是该框架的一种特殊情况。该框架可根据先验知识选取不同的分布作为表征向量的先验分布,以得到不同的自监督学习过程。该方法学习得到的表征向量应用于动作识别下游任务中的性能相比于已有方法有显著提升。

语种中文
页码58
源URL[http://ir.ia.ac.cn/handle/173211/48785]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
高浩元. 面向人体动作识别的自监督学习方法研究[D]. 中国科学院大学. 中国科学院大学. 2022.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。