中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度强化学习裁剪物体背景的弱监督物体定位

文献类型:学位论文

作者郑武
答辩日期2019-06
文献子类硕士
授予单位中国科学院大学
授予地点北京
导师张兆翔
关键词弱监督物体定位,深度强化学习,背景裁剪
学位专业计算机技术
英文摘要

弱监督物体定位是视觉定位中的一类特殊问题,这类任务往往只提供图片的类别标签作为监督信息,区别于强监督定位,后者同时提供图片标签和物体边界框作为监督信息。因此,在监督信息更少的情况下,弱监督物体定位的难度远高于强监督物体定位。然而,更少的监督信息意味着对人工标注数据集的依赖更弱,因而弱监督物体定位可以节省数据标注所花费的大量人力与金钱,并提升弱监督定位算法和模型对于更多数据集的适用性。因此,弱监督物体定位成为近年来的研究热点之一,吸引了学界广泛的注意力。为此,本文提出了一种基于深度强化学习、通过裁剪物体背景的弱监督物体定位方法,并提出了一种新颖的修正方法来进一步提升模型的定位性能,在常用的物体定位数据集上取得了良好的效果。本文的主要创新点包括:
    提出了一种通过裁剪物体背景实现物体定位的方法,将物体背景裁剪过程建模成马尔科夫决策序列,并采用深度强化学习算法寻求最优解,该方法更加符合人类视觉机制,且定位效率较高。
    提出了一种基于卷积特征图重组的弱监督定位修正方法,该方法通过重组图片所提取的特征图,利用特征图中的空间位置信息,校正深度强化学习框架的定位结果,进一步提升了整体框架的定位性能。
    提出了一种可移植性较强的定位框架,易于将其嵌入到已有的卷积分类网络中,同时实现分类和定位任务。

最后本文总结了以上提出的方法中的关键问题和应对策略,以及未来亟待探索的研究方向。

语种中文
页码77
源URL[http://ir.ia.ac.cn/handle/173211/23861]  
专题自动化研究所_智能感知与计算研究中心
推荐引用方式
GB/T 7714
郑武. 基于深度强化学习裁剪物体背景的弱监督物体定位[D]. 北京. 中国科学院大学. 2019.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。