中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于Transformer的几何基元检测与分析

文献类型:学位论文

作者周威
答辩日期2024-07-05
文献子类硕士
关键词基元检测 关系分析 关键点 Transformer
英文摘要

几何基元分析在流程图识别与分析等领域中具有重要的应用价值。然而,由
于基元种类复杂多样,基元参数表示和优化困难,几何基元分析一直是研究的难
点。几何基元检测与几何基元关系分析是几何基元分析的两个重要任务。几何基
元检测主要对几何基元的类别和位置进行识别,而几何基元关系分析则是对基
元之间的关系 (如连接关系) 进行识别。当前的一些几何基元检测方法由经典目
标检测方法扩展而来,这些经典目标检测方法使用矩形框表示物体。然而,使用
矩形框并不能精确表示几何基元,因此无法获取精确的几何基元参数。此外,一
些现有的目标间关系分析方法采用了复杂的模型结构,模型训练困难,并且需要
额外的复杂后处理手段。针对上述问题,本文对流程图中几何基元检测及几何基
元间的连接关系识别展开了相应的研究,本文的主要内容和贡献点如下:
(1) 提出了一种面向流程图解析的通用几何基元表示与检测方案,并构建了
一个面向规则流程图的几何基元数据集。针对矩形框无法精确表示几何基元的
问题,本文提出了一种基于多关键点序列的通用几何基元表示方法。该方法具备
更高的准确性,能更精确地描述各种类型几何基元的形状。在此基础上,本文提
出了一种基于多关键点的通用几何基元检测方案,该方案包含了两种基于多关
键点检测几何基元的方法。同时,针对基于外接矩形框计算的交并比无法准确
地反映基元间重合度的问题,本文提出了一种基于多关键点的交并比计算方式。
该交并比计算方式利用关键点序列的极坐标来计算几何基元间的位置偏移,从
而能更加真实地反映几何基元间的重合度。此外,针对当前规则流程图中几何基
元检测及基元关系分析任务数据集缺失的问题,本文构建了一个面向流程图的
几何基元数据集。该数据集包含了 8000 张机器生成的流程图图像,涵盖了 9 类
几何基元,并附带超过 24 万条标注信息,包括几何基元关键点位置和基元之间
关系。实验结果表明,本文提出的基于多关键点序列的通用几何基元检测方案能
够有效地提高几何基元检测的性能。
(2) 提出了一种基于邻接矩阵预测的基元关系分析方法。针对现有目标间
关系分析方法过于复杂且需要后处理的缺点,本文提出了一种基于邻接矩阵预
测的单阶段基元关系分析方法。该方法将基元关系分析建模成有向图的识别问
题,其中,图上节点代表几何基元,图上的有向边表示基元间的连接关系。因此,
基元间的关系分析问题转化为图的邻接矩阵预测问题。同时,基于任务解耦的思
想,本文提出了一种动态关系邻接矩阵预测损失,使得模型在训练前期更加关注
于几何基元的检测,而在训练后期更加关注几何基元关系分析。实验结果表明,
本文提出的方法能够有效地识别基元间的连接关系。
(3) 构建了一个流程图检测与重建系统。该系统可以运行在各大主流浏览
器中,具有跨平台、高兼容性和易于交互的优点。具体地,本文基于浏览器/服
务器框架构建了一个前后端分离的系统。用户界面在浏览器中展示,以便用户操
作。流程图的识别与重建任务由服务器端完成,从而减轻了系统对用户设备性能
的要求,提升了用户体验。系统的展示结果表明,本文所提方法在实际场景中具
有较高的应用价值。

语种中文
页码80
源URL[http://ir.ia.ac.cn/handle/173211/58574]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
周威. 基于Transformer的几何基元检测与分析[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。