中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
多视几何与数据驱动相结合的深度估计算法研究

文献类型:学位论文

作者陈天
答辩日期2019-06-13
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师张大朋 ; 刘希龙
关键词环境感知 计算机三维视觉 视觉感知 深度估计
学位名称工程硕士
学位专业控制工程
英文摘要

随着视觉感知和深度学习技术的发展,计算机三维视觉在增强现实、自动驾 驶等领域的应用取得了长足的进步。其中,基于视觉的立体信息感知是其中的重 要基础性通用技术模块之一。本文面向不同场景和基于不同的图像数据获取方 式,以获得稠密、精确的场景深度为立足点,开展了多视几何与数据驱动相结合 的深度估计算法研究。

本文分别概述了基于多视几何理论的深度估计算法和基于数据驱动的深度 估计算法研究现状,并分别介绍了这两类深度估计算法的优缺点,介绍了不同输 入图像数据类型的深度估计方法和原理,并对研究背景和意义做了介绍。本文针 对数据驱动的深度估计方法存在的固有缺陷,结合视觉几何方法,做了以下研 究。

首先,设计了 RGB-D 数据驱动的单目深度估计算法框架,将深度梯度图和 深度图进行联合优化,梯度损失在边缘区域响应较大,使得模型专注于图像中物 体的边缘区域。为了进一步提升边缘区域的预测精度,本文在预训练阶段使用数 据归一化方法及边缘区域加权处理方法。同时在模型中引入注意力模块,使得网 络在每层的局部感受域内融合空间和通道信息来构建信息特征,提升网络提取 的特征指向性,进而提高模型的精确度。

其次,设计了双目数据驱动的单目深度估计算法模型框架,根据双目视差重 建理论设计无监督训练模式,避免使用深度真值进行模型训练。使用逆深度进行 三维深度的回归预测,提高室外场景的预测精度。提出了局部平面优化算法,基 于深度信息得到空间法向量,在优化过程中将像素点的法向量差异作为平面约 束条件,提高大平面区域像素的深度预测精度。

最后,针对单目深度估计模型在场景深度预测中存在的尺度不定性问题,设 计了基于多视几何的预测深度和数据驱动预测深度的线性融合模型。多视图存 在的对极几何约束可以较为准确地估计共同观测到的特征点的深度,利用这些 稀疏特征点可以对不同帧的网络输出深度图进行尺度校正。同时,由于图像中的 平面结构不受尺度影响,使用网络输出的深度图进行几何转化可以大致估计中 图像场景中的平面信息,利用这些平面信息对几何深度进行优化。

学科主题计算机感知
语种中文
页码92
资助项目National Natural Science Foundation of China[61503376] ; National Natural Science Foundation of China[NSFC 61633020]
源URL[http://ir.ia.ac.cn/handle/173211/23851]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
陈天. 多视几何与数据驱动相结合的深度估计算法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2019.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。