任意书写方向联机手写中文文本行识别方法
文献类型:学位论文
作者 | 陈懿 |
答辩日期 | 2024 |
文献子类 | 硕士 |
关键词 | 联机中文文本行识别 任意书写方向文本行 原型学习 过切分算法 |
英文摘要 | 联机手写文本识别技术在智能移动设备中得到了越来越多的应用。目前主 流的方法虽然能取得较高的识别准确率,但是其需要合成大量文本行训练数据 或者进行数据增强以提升性能,并且因为无法给出字符切分位置,无法保证良好 的可解释性。同时,目前的方法大多针对水平书写文本行设计,难以用于任意书 写方向的文本行识别。基于过切分的方法模拟人类的认知过程,使用一个单字分 类器对文本行中的字符进行切分和识别,具有较高的可解释性;同时只需要对 过切分模块进行改进便可较好地识别任意书写方向文本行。本文以显式切分为 基本路线,使用卷积原型网络(Convolutional prototype Network, CPN)和双向长 短期记忆网络(Bidirectional Long Short-Term Memory Network, BiLSTM)改进过 切分识别方法实现对任意书写方向文本行的识别并达到具有竞争力的识别性能。 具体贡献如下: 1. 为了缓解联机手写中文文本识别器设计对大量文本行训练数据的需求,提 出了一种利用卷积原型网络的基于过切分的联机手写中文文本行识别方法。为 了进一步提升模型对非字符的拒绝能力,本文使用了字符级的优化目标函数进 行弱监督学习。此外,为了更好地利用字符样本进行训练和识别,本文提出了一 种新的基于文本行几何信息的字符样本归一化方法。与基线模型相比,该模型 在 CASIA-OLHWDB 和 ICDAR2013-Online 数据集上都显著提高了文本行识别性 能;与主流方法相比,识别结果也具有竞争力。证明了本文提出方法的有效性。 2. 为了实现对任意书写方向文本行的识别,本文将任意书写方向的文本行 分为文本行整体旋转和书写方向旋转而文字保持直立两种情况,在预处理阶段 加入一个文本行书写方向检测模块实现对这两种情况的分类。前一种情况经过 旋转矫正后直接进行识别,针对后一种情况,设计了一种基于双向长短期记忆网 络笔画分类模型的改进过切分算法;对任意书写方向文本行进行识别。实验结 果表明本文提出的改进方法实现了过切分框架下对任意书写方向文本行的识别, 并且进一步提升了模型对水平文本行的识别性能。 |
语种 | 中文 |
页码 | 82 |
源URL | [http://ir.ia.ac.cn/handle/173211/57625] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 陈懿. 任意书写方向联机手写中文文本行识别方法[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。