中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度学习的遥感图像目标检测技术研究

文献类型:学位论文

作者黄河
答辩日期2019-05-21
文献子类硕士
授予单位中科院自动化所
授予地点中科院自动化所
导师霍春雷
关键词目标检测 光学遥感图像 深度学习 尺度不变性 旋转不变性
学位名称工学硕士
学位专业计算机技术
英文摘要

目标检测是遥感图像处理与分析领域的一个重要研究方向,其广泛用于资源探测、港口监测、交通疏导等军用和民用领域。随着对地观测技术的进步,获取高分辨率遥感图像的途径越来越多,人们对于从海量遥感图像中提取有价值的信息愈加迫切,这对遥感图像目标检测提出了巨大挑战。传统的基于手工特征的目标检测方法由于鲁棒性差、检测精度较低,已经无法适应当前复杂的图像处理需求。近年来,以深度神经网络为基础的深度学习,通过堆叠多层神经网络逐层提取抽象特征,具有强大的特征表达能力。在多项自然图像识别任务上,基于深度学习的方法都展现出了强大的泛化能力,性能远超基于传统特征的方法。但是,由于遥感图像的特殊性及目标的复杂性(如目标尺度差异巨大、旋转多变性等),基于深度学习的遥感图像目标检测还有很多难点没有解决,限制了实际应用。在这种背景下,本文旨在结合遥感图像的特点,立足目标检测实际应用需求,围绕目标的尺度多变性、旋转多变性这两个瓶颈难点对基于深度学习的遥感图像目标检测技术进行深入研究。主要研究内容与贡献如下:


1. 提出了实例尺度归一化来解决遥感图像中目标尺度变化大的问题。该方法将所有目标都归一化到预设的、较小的尺度范围内训练与测试,可减小尺度变化对检测精度的影响。为了保留图像中目标的特征多样性并加速大尺寸遥感图像的训练,本文结合图像金字塔与贪婪图像块生成法,实现了灵活的实例尺度归一化。该方法的有效性在遥感图像目标检测任务上得以验证,其泛化能力在多个自然图像实例相关的任务上也得到验证。本文基于实例尺度归一化与特征金字塔网络实现了多尺度的遥感图像目标检测,在公开数据集上取得领先精度。
2. 针对遥感图像中目标旋转多变的问题,提出了两种方法。基于可变形卷积的旋转不变目标检测方法,使用可变形卷积取代普通卷积,以实现更好的水平框目标检测。可变形卷积可根据图像内容自适应调整卷积采样位置,提取旋转不变性特征。在训练过程中,可以将可变形卷积的采样偏移初始化为0,以减轻网络训练难度。通过实验发现,在网络的高层使用可变形卷积对于遥感图像目标检测更加有效。基于最适匹配的旋转框目标检测方法(FRCNN-OBB)直接进行旋转框目标检测。旋转框相比水平框能更精准地定位目标位置与方向。在FRCNN-OBB的第一阶段,回归目标是真实目标的最小外接水平矩形框,候选框提取网络在此过程生成候选框;第二阶段回归时,针对候选框与真实框匹配后的回归路径太长的问题,提出最适匹配的方法来缩短回归路径,以减轻回归器训练难度,实验验证了其有效性。
 

语种中文
页码96
源URL[http://ir.ia.ac.cn/handle/173211/23935]  
专题自动化研究所_模式识别国家重点实验室_遥感图像处理团队
推荐引用方式
GB/T 7714
黄河. 基于深度学习的遥感图像目标检测技术研究[D]. 中科院自动化所. 中科院自动化所. 2019.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。