基于图卷积网络的人体骨架行为识别
文献类型:学位论文
作者 | 杨稳杰 |
答辩日期 | 2022-05 |
文献子类 | 博士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院光电技术研究所 |
导师 | 张建林、蔡敬菊 |
关键词 | 人工智能 计算机视觉 深度学习 视频分析 行为识别 骨架序列 图卷积网络 |
学位名称 | 工学博士 |
其他题名 | Human Skeletal Action Recognition via Graph Convolutional Networks |
英文摘要 | 行为识别是计算机视觉中一个非常受重视的研究方向,在智能监控、医疗看 护、手语翻译、人机交互、虚拟现实等领域有着广泛的应用。骨架序列是人体状 态的紧凑表示,避免了背景干扰,数据量小,行为描述能力强。因此,基于骨架 序列的方法是行为识别中一个重要分支。尤其是随着深度学习的发展,基于深 度学习的骨架行为识别日益成为研究热点。近年来兴起的基于图卷积网络的方 法,因其对人体骨架天然结构信息的充分表达,在性能上取得了突破性的进展。 但是,这些方法仍然存在着空间高级语义提取不足,表示能力不够,节点连接混 乱,时空关系建模不完整的问题。本文针对这些问题,对现有方法进行了改进。 针对多种行为涉及的人体区域大小不同,所覆盖的感受野层级较多的问题,本文构建了一个多级语义图卷积网络。该网络在多个语义级别上构建行为描述, 实现了对骨架层次先验知识的有效利用。同时,该网络提高了网络探索大尺度时 空感受野信息的效率,增强了对于不同动作幅度大小的行为的鲁棒性。实验数据 表明,多级语义图卷积网络在获得比此前方法更准确识别精度的同时,减少了一 半的网络层,有着更少的参数量和更快的推理速度。 针对现有图卷积网络表示能力不够、图结构中冗余连接干扰有效关系建模 综上,本文对现有基于图卷积网络的骨架行为识别方法在多级语义建模,空 间图构建和时空关系捕捉上所存在的不足进行了深入研究,并针对这些问题提 出了一些新的方法。这些方法都是结合对骨架行为识别这任务的理解,从不同 角度对现有图卷积方法进行的改进与创新。在NTU-RGB+D、NTU-RGB+D 120、 Kinetics-Skeleton、Northwestern-UCLA等公开数据集上,用实验验证了这些方法的有效性,较现有骨架行为识别方法相比,取得了较为明显的性能提升。
|
学科主题 | 信息处理技术 ; 人工智能 |
语种 | 中文 |
页码 | 136 |
源URL | [http://ir.ioe.ac.cn/handle/181551/10279] ![]() |
专题 | 光电技术研究所_光电技术研究所博硕士论文 |
推荐引用方式 GB/T 7714 | 杨稳杰. 基于图卷积网络的人体骨架行为识别[D]. 中国科学院光电技术研究所. 中国科学院大学. 2022. |
入库方式: OAI收割
来源:光电技术研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。