黎曼流形在图像分类识别中的应用研究
文献类型:学位论文
作者 | 刘天赐1,2![]() |
答辩日期 | 2019-05-14 |
授予单位 | 中国科学院沈阳自动化研究所 |
授予地点 | 沈阳 |
导师 | 史泽林 |
关键词 | 黎曼流形 深度学习 几何优化 图像分类与识别 |
学位名称 | 博士 |
学位专业 | 模式识别与智能系统 |
其他题名 | Research on the Application of Riemannian Manifolds for Image Classification and Recognition |
英文摘要 | 本文以无人飞行器的自动目标识别为研究背景,以非欧几何与黎曼流形为理论基础,并结合深度学习方法,开展黎曼流形在图像分类与识别中的应用研究,对智能学习框架下的多层特征空间进行流形建模,该模型不仅具有更好的普适性,从识别效果上看,对新一代自动目标识别方法的识别准确性与识别效率均有显著性提升。论文对基于黎曼流形的几何目标识别方法和基于黎曼流形的深度学习方法展开研究,取得的相关研究内容和成果包括:(1)基于SL(3; R)群的图像几何变换可视化方法。图像的几何变换是影响计算机视觉中目标跟踪和识别任务有效性的关键因素。虽然掌握图像几何变换的过程具有重要意义,但几何变换的数值关系无法直接从图像本身中揭示出来。针对SL(3; R) 群的黎曼对数映射没有解析表达式这一问题,提出新的方法来求解其上的测地线距离;提出了一种流形可视化方法,将抽象的图像几何变换具体可视化为三维空间中的变化轨迹,使得目标的几何变换过程更加易于理解。(2)基于Grassmann流形核稀疏表征的聚类方法。将稀疏子空间聚类模型拓展至Grassmann流形,综合核函数方法和稀疏编码的优点,找到一种合适的映射核函数,在利用数据的自表达性和黎曼流形的几何特性的同时,学习到Grassmann流形的核稀疏表示;提出了一种实用且高效的聚类算(GKSSC),实验表明,该算法不仅具有良好的鲁棒性,在实时性、准确性和其他聚类指标上均优于现存的方法。(3)基于Grassmann流形的几何降维方法。由于很多视觉数据往往具有流形结构,但这些流形时常具有很高的维数。之前的现存方法都是通过切空间、核函数映射等方法,先将黎曼流形映射到欧氏空间上,再在欧氏空间中进行降维。本论文提出一种基于流形几何性质的几何降维方法,直接从高维流形到低维流形进行降维,在降维的同时还能学习到具有更强分类能力的流形数据,进而提高分类准确率。该算法框架适用于任何的流形测度,而并不只是局限于某一种特定的距离。实验表明,该方法在大大减少计算量的同时,对分类效果也有显著性提升。(4)基于Grassmann流形的几何深度网络。现如今大多数深度学习网络都是以数据的欧氏结构为前提的,而流形学习方法却是以数据的几何结构入手,以黎曼流形理论为基础的一种机器学习方法。本论文构建深度学习框架下多层特征空间的流形模型,设计了一种面向非欧数据的深度学习算法,以Grassmann流形作为网络的输入数据,提出一种深度图像集识别网络。同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题。在动态人脸表情识别中的实验结果表明,所提出的网络与现有的先进算法相比,不仅在结果上识别准确率得到了提高,同时在训练和测试速度上也有一个数量级的提升。 |
语种 | 中文 |
产权排序 | 1 |
页码 | 120页 |
源URL | [http://ir.sia.cn/handle/173321/25150] ![]() |
专题 | 沈阳自动化研究所_光电信息技术研究室 |
作者单位 | 1.中国科学院大学 2.中国科学院沈阳自动化研究所 |
推荐引用方式 GB/T 7714 | 刘天赐. 黎曼流形在图像分类识别中的应用研究[D]. 沈阳. 中国科学院沈阳自动化研究所. 2019. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。