基于深度结构化学习的手写数学公式识别
文献类型:学位论文
作者 | 吴金文![]() |
答辩日期 | 2021-12 |
文献子类 | 博士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院自动化所 |
导师 | 刘成林 |
关键词 | 手写数学公式识别 配对对抗学习 预感知单元 图到图生成 字符原型 |
学位名称 | 工学博士 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 手写数学公式的识别,对于教育、科学传播和自动化等领域都有着重要意 义。相比于一般的文字识别或者图像识别问题,手写数学公式版面复杂,内容多样。因此,手写数学公式的符号检测、符号分类以及结构关系推理等都非常具有挑战性。本文研究手写数学公式的识别以及结构解析问题,利用深度学习和结构化学习的思想提出了几种有效的模型和方法,在手写数学公式识别实验中取得了优良的性能。论文的主要创新工作如下: 2. 提出了一种基于预感知单元的手写数学公式识别方法。基于注意机制的隐式分割模型处理形似的符号或者复杂的结构时,常常对某一符号过注意或者欠注意,导致在识别过程中重复识别或者丢失符号。为了解决这一问题,该方法设计了一种基于预感知单元的解码器,将符号阅读过程的空间信息嵌入在注意机制中,使得识别器能够准确地并行学习每一个符号的视觉和语义对应关系。实验表明,该方法能有效提升手写数学公式识别的精度。
|
语种 | 中文 |
页码 | 124 |
源URL | [http://ir.ia.ac.cn/handle/173211/47472] ![]() |
专题 | 自动化研究所_模式识别国家重点实验室_模式分析与学习团队 |
通讯作者 | 吴金文 |
推荐引用方式 GB/T 7714 | 吴金文. 基于深度结构化学习的手写数学公式识别[D]. 中国科学院自动化所. 中国科学院大学. 2021. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。