历史文档版面分析与文字识别
文献类型:学位论文
作者 | 徐玥![]() |
答辩日期 | 2022-08-22 |
文献子类 | 博士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 刘成林 |
关键词 | 版面分析 文字识别 类别增量学习 文档数据库 历史文档 全卷积神经网络 卷积原型网络 |
学位名称 | 工学博士 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 文档作为信息记录和传播的载体,一直以来对人类的文化和生活有着非常重要的意义。近年来,为了便于计算机的处理与理解,纸质历史文档数字化成为一种趋势。版面分析与文字识别作为文档数字化过程中的两项关键技术,多年来一直受到研究者们的关注,也在各行各业得到了广泛的应用。因此,研究如何准确地对文档图像进行版面分析,并识别其文档内容,是兼具理论意义和应用价值的。在实际应用中,文档的类型多种多样,其相应的版面分析与文字识别技术也各不相同。本文着眼于历史文档图像分析与识别研究,致力于提升版面分析和文字识别两个关键环节的性能。本文的主要贡献归纳如下: |
语种 | 中文 |
页码 | 160 |
源URL | [http://ir.ia.ac.cn/handle/173211/49903] ![]() |
专题 | 毕业生_博士学位论文 |
通讯作者 | 徐玥 |
推荐引用方式 GB/T 7714 | 徐玥. 历史文档版面分析与文字识别[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。