基于神经辐射场的室内三维重建方法研究
文献类型:学位论文
作者 | 刘湘龙![]() |
答辩日期 | 2024-05-15 |
文献子类 | 硕士 |
关键词 | Neural implicit representation Indoor reconstruction Geometric priors Multi-resolution voxel grid Pose optimization |
英文摘要 | 近年来,随着计算机视觉技术和图形学领域的迅猛发展,室内三维重建技术成为研究热点之一。室内三维重建通过二维图像或点云数据还原室内环境的三维结构,在虚拟现实、智能家居、文物保护、室内导航等领域发挥着重要作用。传统的基于几何三维重建方法使用多视图特征匹配进行特征的检测与匹配,然后通过运动恢复结构(Structure from Motion, SfM)的方法估计相机位姿,在将运动恢复结构获得点云稠密化后进行表面重建。该类方法的位姿估计可能会因为特征点匹配不可靠导致重建失败,重建出的网格也会出现产生空洞与大量异常点。 最近提出的基于神经辐射场方法的重建方法可以产生光滑,具有水密性的物体表面。但在对室内重建时由于形状辐射歧义性的存在,在对室内场景进行重建时无法重建真实的表面形状。而且由于室内场景存在大面积的重复或纯色区域,传统的运动恢复结构生成的位姿可能并不准确,影响室内场景重建的质量。 本文探究了在使用神经辐射场对室内场景进行重建的过程中,提高室内表面重建的质量和在不准确位姿下对室内场景进行重建的问题,主要创新成果如下: (1)本文提出了一种使用几何先验的基于多分辨率体素网格的重建方法。本文使用单目几何深度估计模型预测的深度信息与法向信息作为几何先验用于监督室内场景的重建,消除形状辐射歧义性。同时,在重建网络方面,本文改进了多分辨率体素网格结构,采用了由粗到细的体素网格优化策略以及跨体素层梯度求解方式。实验表明,该方法显著提高了室内场景表面重建的质量与视角合成的效果。 (2)本文提出了一种使用相机位姿残差场优化相机位姿提高室内场景重建质量的方法。本文使用相机位姿残差场学习相机位姿的残差用于优化相机位姿。除此之外,本文将目标图片与相邻图片间的特征点进行匹配,计算其对应像素点之间的投影光线距离损失用于监督相机位姿的优化。实验表明该方法能有效提升室内相机位姿估计的准确度,提高了室内场景重建的精度。 |
学科主题 | 计算机科学技术 ; 计算机应用 ; 计算机图形学 |
语种 | 中文 |
页码 | 66 |
源URL | [http://ir.ia.ac.cn/handle/173211/56595] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 刘湘龙. 基于神经辐射场的室内三维重建方法研究[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。