面向大范围场景的高效点云目标检测
文献类型:学位论文
作者 | 范略![]() |
答辩日期 | 2024-05-16 |
文献子类 | 博士 |
关键词 | 目标检测 三维点云数据 大范围场景 实时效率 |
英文摘要 | 三维点云数据提供了对物理世界简洁而精准的刻画,是最基础的三维数据形式之一。 近年来,随着自动驾驶行业的迅猛发展,点云目标检测方法百花齐放,在检测精度上取得了显著提升。 1. 探索适用于大范围场景的输入数据结构。本文提出采用点云的距离视图来作为检测器的输入。距离视图是类似于深度图像的结构化数据形式,感知半径的大小体现在其像素值而非分辨率上,是实现大范围场景高效检测的理想数据形式。但其同时也存在着诸多缺点,比如其二维的形式使得三维结构信息在一定程度上受损,其近似于透视投影的成像方式也使得其上的物体有着较大的尺度变化。本文提出了一系列新颖的技术攻克上述技术难点,使得基于距离视图的检测性能首次达到了与主流基于鸟瞰视图或三维体素的方法相当的水准,并同时为大范围检测奠定了输入数据结构方面的基础。 2. 探索适用于大范围场景的高效基础算子。基础算子是算法的基石,以往的方法主要利用普通卷积、稀疏卷积、以及点操作符等基础算子,然而它们均不适用于大范围场景中的高效检测。在大范围场景和更精细的三维体素表示中,普通卷积由于其需要在密集的特征图上计算而导致了极大的计算开销。稀疏卷积极大弱化了网络有效感受野范围,并且依赖于专业底层开发人员的手工部署。而更为原始的点操作符包含邻域查询、最远点采样等具有极高复杂度的操作,导致其在大范围场景中较为低效。鉴于上述缺陷,本文首次将原生注意力机制引入点云检测领域,并对其进行空间稀疏化,提出了一种基于注意力机制的稀疏算子,它天然地适应了空间分布不均匀、不定长的点云数据特性,并且具有更大的感受野,为大范围的高效点云目标检测奠定了算子方面的基础。 3. 探索大范围场景下的整体检测框架构建。目前的主流检测方法整体地、或者部分地依赖于鸟瞰视图下的密集特征图,这是其无法有效拓展到大范围场景的核心原因之一。本文基于上文所述的数据基础和算子基础,进一步通过稀疏实例识别技术克服了稀疏结构中物体“中心特征缺失”问题,从而构建了一种完全稀疏的整体检测框架。该框架中不再存在任何空间密集的结构,理论上可以拓展到任意大的感知半径。至此,本文实现了大范围场景中的高效点云目标检测这一目标,并为后续的综合应用提供了条件。 4. 探索基于大范围高效检测框架的综合应用。大范围高效检测算法除了在车辆上实际部署外,还有一个重要的应用是三维物体自动标注。算法的大范围的特点使其可以覆盖极长的物体运动轨迹,从而获取长时序的信息来提升物体的自动标注精度。算法的高效性也可以进一步缩短标注周期。因此,本研究最后一部分的内容致力于整合前期在大范围高效检测上的成果,并引入超长轨迹信息提取技术,构建一个可以利用超长时序信息的高精度离线自动标注系统。该系统的标注精度首次超越了人类标注员的平均精度,极大降低了数据积累和算法开发周期。 总而言之,本文从数据、算子、整体架构、综合应用四个方面对面向大范围场景的高效点云目标检测展开了递进式的全面研究。提出了一系列新颖的技术解决了大范围场景中点云目标检测的效率瓶颈,构建出了一个完整的大范围高效检测框架,首次实现了200米以上感知半径的实时检测以及超越人类精度的三维物体自动标注,具有相当的实际应用价值与学术研究意义。 |
语种 | 中文 |
页码 | 110 |
源URL | [http://ir.ia.ac.cn/handle/173211/57416] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 范略. 面向大范围场景的高效点云目标检测[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。