中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向联机手写中文数据的深度生成算法研究

文献类型:学位论文

作者任敏思
答辩日期2024-05
文献子类硕士
关键词深度生成模型 联机手写中文生成 条件扩散模型
英文摘要

近些年来,随着手机、平板电脑、电子黑板等移动触控设备的发展与普及, 手写数据在我们的日常生活中变得越来越流行,因此对手写数据的分析与处理 是一项具有广泛应用场景的研究问题。另一方面,读与写是人类智能中的两项重 要能力,而在人工智能中,它们分别对应着对文档数据的识别与生成。因此,从 研究意义的角度出发,手写数据生成是对人类智能中一项重要能力的模拟,是一 项有趣而富有创造力的任务。一般来说,手写数据有两种不同的表示方式:第一 种基于光栅图像,被称为脱机手写数据;另一种基于轨迹点序列,被称为联机手 写数据。本文主要关注联机手写中文数据的生成任务,主要的研究成果如下: 一. 提出一种基于条件扩散模型的风格化联机手写汉字生成的方法。我们将 非自回归的扩散模型应用到轨迹点序列生成的任务上,并通过增加字符结构编 码字典与书写风格编码器两个模块,实现了生成指定类别汉字、同时模仿指定书 写风格的功能。在公开手写数据集 CASIA-OLHWDB 上的一系列实验验证了方 法的有效性,并取得了比同网络架构下的自回归生成方法更优越的性能。 二. 实现了文本行级别的联机手写中文生成这一很少被探索的任务。我们提 出了一种层次化的生成方法:首先设计了一个布局规划器模块,它可以基于目标 文本内容和给定的手写文本行书写风格参考样本进行上下文学习,并为文本行 中每个字符生成边框信息;而基于条件扩散模型的字符生成器将在边框位置依 次生成对应的字符,从而完成完整文本行的书写。通过将字符的位置尺寸信息的 生成与字符结构生成这两个部分解耦开,使得完整文本行生成的过程更加可控 与鲁棒。

语种中文
页码64
源URL[http://ir.ia.ac.cn/handle/173211/56675]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
任敏思. 面向联机手写中文数据的深度生成算法研究[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。