中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度学习的机器人视觉三维环境感知研究

文献类型:学位论文

作者刘洁锐
答辩日期2024-05
文献子类博士
关键词机器人视觉感知 大范围空间结构 局部精细化物体语义 分层式三维环境感知系统
英文摘要

       机器人良好的三维环境感知能力是其提供优质服务的重要前提和保障。对机器人感知而言,视觉感知以其适用范围广、信息量丰富、部署成本低等特点受到广泛关注。机器人在实际非结构化环境中的作业往往涉及大范围导航和局部场景物体操作等不同层级的任务,这就需要机器人具备分层式的三维环境感知能力。本文面向基于深度学习的机器人视觉三维环境感知,从大范围空间结构和局部精细化物体语义两个层级深入开展研究,为机器人在复杂环境下的智能自主服务提供感知支撑,具有重要的理论研究意义和广泛应用前景。论文的主要内容如下:

       首先,介绍了机器人视觉三维环境感知的研究背景和研究意义,从大范围空间结构感知和局部精细化物体语义感知两个方面进行了现状综述,并对论文内容和结构做了介绍。

       其次,提出了一种基于几何先验和像素级灵敏度的时序单目深度估计网络,实现大范围空间立体信息的感知。针对单目深度估计方法相机位姿估计准确性不足的挑战,借助时序光流信息引入几何约束,并结合先验深度图实现准确的相机位姿估计。为了提升深度编码的泛化性,结合时序帧的几何先验构建先验特征一致性正则化,辅助优化深度编码器。并构建灵敏度自适应深度解码器,通过建模深度预测对不同像素的敏感性,进而选择性地调节代价量与最终深度预测之间的短连接路径,缓解输入帧不同像素的灵敏度差异对深度预测的影响,提升深度估计的准确性。在此基础上,结合视觉里程计为机器人提供定位信息。在数据集上的实验表明了所提方法的有效性。

       第三,设计了一种基于双流紧凑深度变换和特征校正的鸟瞰视角语义分割网络,获取空间语义分布,并与大范围空间立体信息共同构成了大范围空间结构信息。一方面,构建双流紧凑深度变换网络,对不同时序帧进行选择性组合,以兼顾深度预测和鸟瞰特征集成,并通过差异化降低待匹配时序帧特征的分辨率,优化深度预测中代价量的计算。另一方面,设计基于特征校正的分割网络,利用可变形卷积神经元的感受野自适应可变特性,促使分割网络自采样对应空间区域特征,实现对输入特征映射的校正,同时通过语义对比学习更好地训练分割网络。此外,引入虚拟相机内参提升三维感知任务学习对二维图像数据增广的兼容性。在数据集上对所提方法进行了验证。

       第四,面向局部场景精细化语义感知,提出一种基于结构自编码器和推理注意力的类别级物体位姿估计网络,实现物体类别和姿态等语义信息的获取。设计同一类别不同实例的重构损失以挖掘相同类别物体图像中的共享结构特征,以此学习得到结构自编码器,有效提升彩色图像特征的类别泛化性。进一步地,构建推理注意力解码器,结合图像和深度点云特征对类别属性进行隐性建模并对特征进行推理,以此得到更有价值的特征表达。考虑到解码器中参数交互较多导致学习难度较大,还采用梯度解耦策略对推理注意力解码器和点云特征提取器进行解耦,加速整体网络收敛。所提方法在数据集和真实场景中进行了实验验证。

       第五,机器人局部场景精细化感知还应满足物体类别语义扩展的需求,为此,提出了基于通用特征学习的小样本物体检测网络。针对现有小样本物体检测骨干网络所提取特征具有基类有偏性,导致新类适应性弱的问题,构建了双分支骨干网络,在原有骨干网络的基础上添加平行的新分支以保留更多的类别无关特征,并结合概率路径选择和基于源的通道丢弃,设计特征聚合方法对双分支的特征进行有效集成。集成后的通用特征既保留了对新类物体的兼容性,同时也增强了特征的可判别性。同时构建松弛对比损失辅助网络训练,通过挖掘难样本对信息提供额外监督信号,促进了检测网络的学习。所提方法的有效性在数据集上进行了验证。

       第六,将上述空间结构和精细化物体语义两个层级的感知方法在ROS框架下集成起来,构建分层式的机器人三维环境感知系统,设计了包括大范围空间结构感知层、局部精细化物体语义感知层、感知融合层和感知控制层的软件架构,利用大范围空间结构信息生成环境度量地图,并将局部场景中感兴趣物体的类别、位置和姿态等语义信息嵌入其中,形成度量化全局物体语义地图,提供机器人自主作业所需的感知基础。机器人实际实验验证了所提感知系统的有效性。

       最后,对本文工作进行了总结,并指出了需要进一步开展的研究工作。

学科主题电子、通信与自动控制技术
语种中文
页码124
源URL[http://ir.ia.ac.cn/handle/173211/57079]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
刘洁锐. 基于深度学习的机器人视觉三维环境感知研究[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。