图像理解中的高层随机建模方法研究与应用
文献类型:学位论文
作者 | 张慧 |
学位类别 | 博士 |
答辩日期 | 2008-05-19 |
授予单位 | 中国科学院电子学研究所 |
授予地点 | 电子学研究所 |
导师 | 王宏琦 |
关键词 | 图像理解 目标识别 场景分析 随机几何理论 图像高层模型 |
其他题名 | Research and Application of High-level Stochastic Modelling in Image Understanding |
中文摘要 | 图像理解是一门综合学科,与计算机视觉、人工智能等高层视觉研究领域有着密切的联系。图像作为重要的信息载体之一,直观地向人类传递关于客观场景的丰富信息,是人类间接感知世界的一种主要手段。作为当前计算机研究与应用领域的热点和难点,图像理解具有重要的理论研究意义和广阔的应用前景。 图像理解是高层的图像处理任务,包括目标识别、场景分析等子任务。由于图像数据本身存在含糊性,图像理解中的信息获取、知识表述以及目标识别等都存在信息不确定性问题。从统计概率角度出发,图像模型作为一般的先验知识,为图像理解过程中不确定性因素的定量化估计提供了基本工具。目前的图像模型(例如MRF、Gibbs等)以图像的低层数据为研究对象,忽略了目标之间的空间相关性以及图像的全局特征,因此,无法适用于高层图像处理任务。 针对图像理解中的目标识别与场景分析问题,本文以随机几何理论和空间统计学为理论依据,着重研究了在图像理解中基于高层数据的随机模型建立、表征、分析和优化。基于高层数据的随机模型利用Markov过程对图像中的目标进行建模,不仅将图像数据产生的数据约束,而且考虑了目标的形状、位置等特征的先验知识约束,为目标识别、场景分析等图像理解任务提供一个统一的解决思路和理论框架。 本文的主要创新点为: 1.提出了基于图像数据的自适应随机建模方法。该方法以图像数据为主要信息来源,对场景中的目标模式进行特征分析以及空间约束建模,在随机模型的迭代优化过程中,通过定量化地考察过程模型的相关性和统计特征来形成有关场景的“知识”信息,并应用此信息来“指导”空间统计模型中的参数进行自我学习、修正。与目前的图像高层模型相比较,该建模方法具有适用性强、收敛速度快等特点。 2.提出了基于目标图示结构的随机建模方法。该随机模型将目标视作若干有限的目标部件的组合,对部件特征及部件的空间配置进行Markov过程建模,有效地解决了具有类内差别的同类目标识别与形状描述问题。将目标部件过程与图像场景的目标过程模型相结合,构建了分等级的随机模型,为较复杂场景中具有类内差别的多目标识别提供了完备的解决方案。 3.提出了基于目标及目标阴影的3D几何模型,该模型结合了地物的高度信息投影在二维图像平面上的阴影特征,将目标的阴影信息作为非常重要的检测特征和定位信息,实现在对比度低、场景复杂的图像中的目标粗定位。3D几何模型充分考虑了三维地物的成像特点、目标阴影在灰度遥感图像中的几何特征和像素分布特点。 4.提出了基于图像数据的动态规划求解方法,该动态规划求解方法是在目前随机迭代求解方法基础上,根据目标在图像上的显著特征以及“前景”与“背景”的特征差别产生将随机模型向最优化配置迭代的“驱动力”,利用图像的特征信息指引图像随机模型的最优化迭代求解过程。基于图像数据的动态规划求解方法不仅加快模型随机迭代的收敛速度,而且提高了目标定位的精准度。 5.提出了基于多变量(multi-variation)随机模型的场景分析框架,采用多变量随机过程对不同种类目标之间的约束机制进行先验建模和统计分析,同时,对图像数据进行高斯混合模型建模。场景分析框架的提出是对传统目标过程模型在图像理解中的扩展,将场景视作由若干有限类别的典型地物的组合,不仅实现了图像场景的高层模式分析与整体建模,而且也符合人类视觉对真实场景的判读和解释。 |
语种 | 中文 |
公开日期 | 2011-07-19 |
页码 | 134 |
源URL | [http://ir.ie.ac.cn/handle/80137/8581] ![]() |
专题 | 电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文 |
推荐引用方式 GB/T 7714 | 张慧. 图像理解中的高层随机建模方法研究与应用[D]. 电子学研究所. 中国科学院电子学研究所. 2008. |
入库方式: OAI收割
来源:电子学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。