基于无人机影像的高精度大场景三维建模
文献类型:学位论文
作者 | 金鹏飞 |
答辩日期 | 2024-06 |
文献子类 | 专业学位 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院地理科学与资源研究所 |
导师 | 余卓渊 |
关键词 | 神经辐射场 神经网络 隐式表达 农业场景 三维可视化 |
学位名称 | 硕士 |
学位专业 | 农业工程与信息技术 |
英文摘要 | 神经辐射场(NeRF)作为一种新颖的利用神经网络隐式表达三维场景的方法,其能够合成任意视角的图像,已被成功应用于物体和房间级别的三维场景(<50m2)建模。然而,由于神经网络的容量限制,无人机捕获的大范围农业场景(>10000 m2)的渲染效果常常显得模糊且缺乏细节,简单地增加模型容量或样本点数可能会显著增加训练成本。现有的空间收缩方法被设计用于朝向一致或360度旋转的相机轨迹,不适用于无人机特有的拍摄轨迹。此外,大场景中复杂的光照条件和无人机稀疏采集产生的异常值和云雾伪影会严重损害渲染质量。 为应对这些挑战,本文提出了一种专为无人机视角下大范围农业场景设计的神经辐射场模型,开展并完成了以下研究工作: (1)为了适应无人机环绕式拍摄轨迹,本文提出空间界定压缩法来设定无人机拍摄场景的边界:通过应用轴对齐包围盒来限定大规模复杂三维空间的渲染范围,从而降低计算复杂性并提高神经辐射场的渲染效率。同时,本文还提出了一种地表优化采样策略,用以改进NeRF的采样过程:通过集中更多采样点于三维场景中存在有效内容的区域,从而提升采样效率并增强远端地表的可视化质量。 (2)针对原始NeRF模型在计算成本和训练时长上的局限性,本文使用特征网格与多层感知机(MLP)共同表达三维场景:通过引入多分辨率哈希网格直接将特征存储在哈希表中,以获取场景的先验信息并减轻神经网络的负担。同时,本文提出了一种基于星团采样与集成哈希编码的抗混叠神经渲染模型:通过在原有采样点周围增设新的采样点并进行编码处理,成功克服了哈希编码在连续性和捕捉高频细节方面的不足,改善了远景的细节表现,进一步提升了渲染精度。 (3)在损失函数的设计上,本文引入了L1范数损失来最小化预测与真实值之间的绝对差异,增强了NeRF模型在处理拍摄视角相对稀疏的场景时对异常值的鲁棒性。进一步地,本研究通过应用熵正则化损失来优化体积密度分布并鼓励不透明渲染,有效减少了由场景中瞬态因素引起的半透明漂浮物和视觉伪影。 (4)为验证本研究方法的有效性,本文分别在四个代表性的农业场景上进行了试验,实验结果表明,与专为无人机拍摄场景设计的Mega-NeRF相比,本研究在峰值信噪比这一精度指标上实现了3.31dB的提升,同时在处理速度上显著加快,提升了近100倍。与摄影测量学领域中广泛应用的多视图立体匹配(MVS)算法相比,本研究在峰值信噪比这一精度指标上取得了8dB的显著提升。 本研究构建的大范围农业场景三维可视化模型,能够提供接近真实照片级别的渲染效果,极大地丰富了数字孪生和元宇宙等前沿应用的视觉体验。 |
语种 | 中文 |
页码 | 74 |
源URL | [http://ir.igsnrr.ac.cn/handle/311030/208035] ![]() |
专题 | 地理科学与资源研究所_研究生部 |
推荐引用方式 GB/T 7714 | 金鹏飞. 基于无人机影像的高精度大场景三维建模[D]. 中国科学院地理科学与资源研究所. 中国科学院大学. 2024. |
入库方式: OAI收割
来源:地理科学与资源研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。