中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
表格识别系统应用中若干问题的研究

文献类型:学位论文

作者卜飞宇
学位类别博士
答辩日期2004
授予单位中国科学院软件研究所
授予地点中国科学院软件研究所
关键词表格识别 表格与图形鉴别 表格框线去除 图像倾斜检测与校正
其他题名A Study on Some Problems in The Application of Form Recognition System
学位专业计算机应用技术
中文摘要表格是一种常见的文档形式,广泛地应用于人们的日常工作和生活之中。随着计算机技术的发展,利用计算机获取、存储和管理数量巨大的表格信,息已越来越成为人们关注的焦点。表格识别系统已开始成为替代人工录入、自动获取表格信息的一种有效工具。针对现有表格识别系统在应用中遇到的一些问题,本文对表格与图形的鉴别、彩色票据图像表格框线的去除、灰度与彩色表格图像的倾斜角度检测等几个问题进行了深入研究,并取得如下一些成果:1、现有系统中,鉴别表格与图形的误判率较高。本文提出了一种根据表格框线和单元信息来区分表格与图形的方法,该方法结合表格的结构特征,提出了作为表格要素的表格框线和表格单元所必须满足的若干约束条件,通过验证每个条件是否得到满足来区分表格与图形。实验表明,该方法能有效地降低对表格与图形的误判率。2、字线交迭严重干扰对字符的切分与识别。以前的基于二值图像的表格框线去除算法,只能在一定程度上排除表格框线对字符识别的干扰。随着计算机运算速度和存贮容量的迅速提高,表格识别系统的扫描输入图像开始采用灰度和彩色图像。本文提出了一种基于彩色图像的表格框线去除算法,由于利用了彩色和灰度信息,能更好的排除表格框线对字符识别的干扰。该方法目前已成功地应用于银行票据识别系统中。3、为解决灰度和彩色票据图像倾斜问题,本文提出了一种根据扫描时产生的黑色边缘来检测扫描图像倾斜角度的方法。该方法根据检测出的四条边缘拟合直线来确定图像倾斜角度。实验表明,该方法具有很快的速度和很高的正确率,且适应于所有白色(浅色)矩形纸张扫描的灰度和彩色图像。目前,该方法已用于彩色银行票据和灰度名片图像的倾刹校正与去除黑边。
语种中文
公开日期2011-03-17
页码54
源URL[http://ir.iscas.ac.cn/handle/311060/6218]  
专题软件研究所_中科院软件所_中科院软件所
推荐引用方式
GB/T 7714
卜飞宇. 表格识别系统应用中若干问题的研究[D]. 中国科学院软件研究所. 中国科学院软件研究所. 2004.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。