自然场景图像文本检测方法研究
文献类型:学位论文
作者 | 邱泉1,2![]() |
答辩日期 | 2017-12 |
授予单位 | 中国科学院大学 |
授予地点 | 北京 |
导师 | 刘成林 |
关键词 | 自然场景文本检测 自然场景文本提取 最大稳定极值区域 平面化 |
英文摘要 | 日常生活中,人们无时不刻地接触大量自然场景。自然场景中不仅包含大量的图形信息,而且存在丰富的文本信息。与一般的视觉元素不同,文字包含了丰富的高层语义信息,能够帮助计算机更为准确地解读图像内容,图像文本检测对图像理解有着重要的意义。现在,市场研发比较前沿的如翻译软件、汽车自动驾驶、图像检索、人机交互、增强现实等,无不需要机器能够理解自然场景中的文本信息。因此,能够准确和高效地检测场景中的文本信息的算法成为市场迫切的需求,也是文档分析和识别领域的重要研究内容之一。 目前对自然场景图像文本检测方法和技术主要有以下几个大的方向,基于区域的方法、基于连通域的方法、深度学习的方法。 在基于连通域的方法中,最大稳定极值区域受到追捧和广泛应用。基于此方法,在本文中,我们提出了一个平面化的最大稳定极值区域方法,该方法能够在不需要训练的情况下,有效快速削减大量重复的最大稳定极值区域,以提高场景文本检测的速度和准确率。在ICDAR 2013鲁棒阅读数据集上,我们的方法能够削减70%冗余的最大稳定极值区域,并且相比传统的最大稳定极值区域,程序运行速度能提升接近一倍。 和其他的方法作比较,我们的方法仅需要对文本和非文本连通区域训练分类器,所需的训练样本较少,不需要太长的训练时间。对最大稳定极值区域的削减极大地降低了计算复杂度,提升了运行效率。实验结果亦能达到当前最前沿的方法的性能,表明了该方法的有效性。 |
源URL | [http://ir.ia.ac.cn/handle/173211/15616] ![]() |
专题 | 毕业生_硕士学位论文 |
作者单位 | 1.中国科学院大学 2.中国科学院自动化研究所 |
推荐引用方式 GB/T 7714 | 邱泉. 自然场景图像文本检测方法研究[D]. 北京. 中国科学院大学. 2017. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。