中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
交通场景图像多元素内容解析

文献类型:学位论文

作者郭云飞
答辩日期2024-05-17
文献子类博士
关键词端到端交通场景解析 交通标志解析 关系推理 视觉交通知识图谱
英文摘要

交通场景图像的感知与理解对智能交通系统的综合性能和应用效果具有重要影响。通过解析图像中的关键交通元素,如道路、车道、交通标志等,系统能够实时监测交通状态,准确获取环境信息,为自动驾驶系统提供决策支持,提高交通顺畅性和行车安全性。交通场景感知和理解也是模式识别和计算机视觉领域的重要研究内容。本文研究交通场景图像中道路、车道以及交通标志等多种元素的解析问题,提出了几种方法逐步实现对交通场景图像中多元素的内容解析:首先研究交通标志的内容解析,然后推广到整个交通场景图像中多种元素的整体解析。论文的主要创新工作如下:

(1)提出了一种基于检测和关系推理的交通标志解析框架。该框架首先通过组件检测模块确定组件位置和类别,然后通过关系推理模块分析组件之间的关系,并通过标志分类模块获取交通标志的类别,最后通过启发式的语义描述模块生成交通标志的语义描述。结合交通标志的特点,该框架的每个模块都进行了针对性的改进,显著提升了不同子任务的性能,最终在多任务协同下实现准确解析。实验结果表明,该框架在多种交通标志上均取得了良好的效果。

(2)提出了一种基于版面感知的交通标志语义描述方法。该方法包含一个动态预测的Transformer模型,该模型能融合视觉、空间、语义和关系等多种特征,自动生成语义描述。与启发式方法不同,该方法摆脱了对规则和模板的依赖,具有更强的鲁棒性和普适性。在相关数据集上的实验结果表明,该方法能有效改善模型的交通标志语义描述能力,显著提升最终性能指标。

(3)提出了一种基于层次化推理的交通场景关系解析方法。该方法引入层次化的图注意力网络,通过构建层次图以不同的方式处理交通场景图像中不同类型的元素,并通过添加跨级链接实现了不同层级间信息的传递,最终以高效的方式推理出不同元素之间的复杂关系。实验证明,该方法在效果上显著优于经典的图神经网络,具备良好的关系推理性能,并且能够有效地获取元素关系以辅助视觉交通知识图谱生成。

(4)提出了一种基于查询去噪的端到端交通场景解析框架。该框架通过宏观感知模块实现粗粒度的道路和车道分割以及交通标志检测,通过微观感知模块实现细粒度的交通标志组件检测,通过关系推理模块以层次化方式实现多元关系推理和文本属性识别。该框架完全基于查询预测方法,通过创建多种查询实现不同任务间的信息传递,并且引入了查询去噪训练以提高查询的表达和预测能力。实验结果表明,该框架有效地实现了交通场景图像多元素内容的整体解析,生成了准确的视觉交通知识图谱,并在有关数据集上取得了最佳性能。

学科主题计算机感知
语种中文
页码106
源URL[http://ir.ia.ac.cn/handle/173211/57395]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
郭云飞. 交通场景图像多元素内容解析[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。