中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于多层感知机的三维人手实时多目重建方法研究

文献类型:学位论文

作者杨健
答辩日期2024-05-16
文献子类硕士
关键词多层感知机,人手几何建模,三维人手重建,实时多目重建
英文摘要

通过视觉系统对人体运动以及用户意图进行感知是虚拟场景下智能人机交
互的主要方式。其中,基于视觉的三维人手重建方法旨在通过相机系统实时重建
出用户人手的几何外形。利用该项技术能够实现虚拟三维物体与用户人手的精
确碰撞交互,提升用户体验的真实感。区别于先前的三维人手重建方法,本研究
致力于通过多目相机提供的立体视觉信息缓解深度模糊性问题和人手的自遮挡
问题,以实现高精度的三维人手重建,并通过高效的人手三维建模方法来提高多
目人手重建算法的效率进而实现实时推理。本文围绕人手的高效建模和实时的
多目三维人手重建方法两个方面进行研究:
(1)人手的高效建模。本文推广了隐式神经几何表示的一般框架,提出了一
种多层感知机架构的人手几何显式建模方法。该方法使用分而治之的策略,将高
度非凸的人手几何分解为一系列凸组件,实现一种几何解耦的逐骨骼重建。而对
于每个局部几何,本文又提出了一种三轴建模的思路,将隐式神经几何表示的单
值回归框架推广为显式点云的逐坐标多值回归框架。利用该框架本文实现了局
部点云几何的高效建模。在多个数据集上进行的实验证明了本文提出的三维人
手点云建模方法的高效性。具体来说,相比基于隐式几何表示的人手建模方法,
本文的三维人手点云建模方法同样具有亚毫米级别的精度,但是在推理速度上
实现了三个数量级的提升。而相比于基于学习的显式网格建模方法,本文的方法
在精度上和推理损耗上均实现了大幅度的领先,单次推理仅需5 毫秒且建模精
度达到了亚毫米级别。
(2)实时多目三维人手重建。本文进一步推广了所提出的三维人手点云表
示,提出了一种几何上更稠密、网络结构更轻量的三维人手网格表示。然后基于
该三维人手网格表示方法,提出了一个实时的多目人手重建方法。该多目人手重
建方法首先从多目的视觉信息中进行三维人手骨架的估计和视觉特征提取,然
后将视觉信息以一种无噪声的信息注入方式传输给训练好的三维人手网格表示
模型中,实现了基于视觉信息的增强预测。在多个公开数据集上的实验,证明了
本文所提方法的高效性。相比于最先进的多目人手重建方法,本文提出的方法在
精度上相当,但是在推理速度上实现了两倍的提升,达到每秒60FPS 的推理速
度。这证明了本文方法的合理性和高效性。

语种中文
页码80
源URL[http://ir.ia.ac.cn/handle/173211/57065]  
专题毕业生_硕士学位论文
自动化研究所_毕业生
推荐引用方式
GB/T 7714
杨健. 基于多层感知机的三维人手实时多目重建方法研究[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。