中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向自动驾驶的车路协同融合目标检测技术研究

文献类型:学位论文

作者张才集
答辩日期2024-05-16
文献子类硕士
关键词自动驾驶 车路协同 环境感知 目标检测
英文摘要

环境感知技术是自动驾驶系统的关键核心技术之一。常规的感知技术方案利用不同模态的传感器,包括RGB 相机和激光雷达等,设计基于卷积神经网络和深度自注意力变换网络的深度学习模型以实现目标检测、跟踪与分割等感知任务,在自动驾驶车辆上取得了较好应用。但是,在实际应用场景中仍存在许多技术挑战,比如,密集交通流情况下的车辆间遮挡、复杂交叉路口的感知视野受限等问题。随着5G 和车联网(Vehicle to Everything,V2X)通信技术的快速发展,车路协同技术为突破单车感知性能极限提供了一种有效的技术路径,通过在交通环境中部署分布式传感器以进行协同式感知,可以全方位实施车-车、车-路实时动态信息交互,为网联车辆提供路侧增强感知和环境信息辅助等技术服务。

本文重点研究基于车路协同的三维目标检测和协同融合策略,具体研究路侧视角的纯视觉目标检测和车路协同融合三维目标检测算法。其中,在车路协同融合三维目标检测算法的研究中,考虑到自动驾驶车辆常采用多个相机和激光雷达配置,因此分别研究基于纯视觉的协同融合与基于相机和激光雷达的协同融合。本文的研究内容和贡献总结如下:

 

(1)通过分析路侧视角与车辆前向视角样本空间的差异,改进M3D-RPN模型,设计了一种M3D-RA-RPN 模型,提升了路侧视角单目相机的检测性能。在基线模型中,针对车辆前向视角设计的深度感知 (Depth-aware)卷积在路侧视角的检测效果不佳,提出了一种极线感知(Ray-aware)卷积取代车辆前视视角的Depth-aware 卷积,另外,实验表明基于2D-3D 几何一致性的后优化算法在路侧视角会降低3D检测的性能,本文设计了一种端到端无后处理的神经网络模型M3D-RA-RPN。相比基线模型,M3D-RA-RPN模型在路侧数据集Rope3d上有效提升了单目3D目标检测和BEV目标检测的性能。

 

(2)基于纯视觉的车路协同三维目标检测算法,提出了一种基于BEV空间全局非极大值抑制的后期结果协同算法(V2X-BGN)。针对极端遮挡的交通路况,对基于纯视觉的算法和基于激光雷达的算法进行了对比,并且在V2XSet数据集上对V2X-BGN做了消融实验,实验验证了单车BEVFormer算法和全局非极大值抑制后处理模块在协同感知任务上的有效性。在遮挡情况下,车路协同融合感知任务中两种方案具有互补优势,提出了一种基于距离阈值的结果级后融合算法,可以有效提升车路协同融合检测性能。此外,本文基于关系型数据库对V2XSet数据集做了标准化改造,使其便于在其他视觉感知任务和视觉感知模型上进行实验。

语种中文
页码64
源URL[http://ir.ia.ac.cn/handle/173211/56497]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
张才集. 面向自动驾驶的车路协同融合目标检测技术研究[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。