面向越野环境驾驶态势感知的多模态自监督表达学习
文献类型:学位论文
作者 | 杨溢![]() |
答辩日期 | 2024-05 |
文献子类 | 硕士 |
关键词 | 多模态自监督表达学习 越野环境态势感知 自动驾驶 |
英文摘要 | 随着自动驾驶技术的快速发展,其在城市道路环境下的应用已取得显著成果。然而,在非结构化的越野环境中,自动驾驶系统面临着更为复杂和多变的挑战。这些挑战包括不规则地形、缺乏明确道路标志、不可预测的自然障碍物等,严重限制了自动驾驶技术的应用范围和效率。为了提升自动驾驶系统在越野环境中的可靠性和稳定性,本研究提出利用多模态自监督表达学习的方法来提升自动驾驶车辆面向越野环境的驾驶态势感知能力。 本研究首先面向地外星表环境探索需求,在地外模拟环境中建立了一个基于车载感知平台的多模态地貌识别基准数据集,该数据集涵盖了高清摄像头、360度全景相机、激光雷达、惯性导航模块、GPS 等多种传感器数据。数据集包含了单一和混合地貌地形的数据,以提高经过数据集训练得到的模型的鲁棒性和泛化能力。同时我们设计了多种基线模型,包括传感器时间序列基线模型和视觉基线模型,通过对比不同模型结构和特征处理方法,评估了各类模型在地貌和地形分类任务上的性能。 针对越野环境的结构化信息稀缺、标注标准难统一、人工标注成本高的困难,本研究探索了两种多模态自监督学习方法:多模态聚类自监督预训练和多模态对比学习自监督预训练。这些方法利用数据本身的结构和分布信息作为监督信号,无需人工标注,从而降低了数据准备的成本,并提高了模型的泛化能力。在多模态聚类自监督预训练中,通过学习聚类伪标签为优化目标,使不同模态编码器能够互相学习对方的伪标签,从而提高特征的互补性和协同性。而在多模态对比学习自监督预训练中,通过构建三元组样本,对齐车辆对外界环境的观测、车辆本体自身的运动状态和驾驶员的控制动作,进一步提高了模型对多模态数据的理解能力。 为了验证所提出方法的有效性,本研究在自建数据集和公开数据集上进行了广泛的实验。实验结果表明,多模态自监督学习方法在多个评价指标上均优于传统的有监督学习方法。特别是在车辆动力学预测和可行驶区域分割这两个下游任务上,预训练得到的编码器显著提高了模型的性能。在车辆动力学预测任务中,结合预训练的运动状态编码器的先进的时间序列预测模型显著提高了预测的准确性。在可行驶区域分割任务中,利用预训练的视觉编码器,提高了纯视觉模型对越野环境中可通行区域的识别能力,达到了几乎和有点云深度信息一样的性能。 总结而言,本研究通过多模态自监督学习的方法,有效地提升了自动驾驶系统在越野环境中的态势感知能力。这项研究不仅为自动驾驶技术的发展提供了新的视角和方法,也为相关领域的研究者提供了宝贵的数据集和算法参考。未来,希望本研究的成果能够推动自动驾驶技术在非结构化环境中的应用,为自动驾驶车辆提供更加安全和可靠的越野驾驶解决方案。 |
语种 | 中文 |
页码 | 84 |
源URL | [http://ir.ia.ac.cn/handle/173211/57339] ![]() |
专题 | 毕业生_硕士学位论文 自动化研究所_智能感知与计算研究中心 |
推荐引用方式 GB/T 7714 | 杨溢. 面向越野环境驾驶态势感知的多模态自监督表达学习[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。