基于视觉和语义特征增强的零样本学习研究
文献类型:学位论文
作者 | 贾真![]() |
答辩日期 | 2020-05-31 |
文献子类 | 博士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院自动化研究所 |
导师 | 谭铁牛 |
关键词 | 零样本学习 图像物体分类 深度学习 卷积神经网络 多模态知识迁移 跨模态映射 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 图像物体分类是计算机视觉领域的基本问题。近年来,随着以卷积神经网络为代表的深度学习技术的不断发展,图像物体分类方法取得了长足进步。但是,目前基于卷积神经网络的图像物体分类方法在模型训练阶段十分依赖大规模图像数据集。与之不同的是,人类可以通过阅读和聆听等方式,从其他模态的描述性知识中快速学习一个新物体类别的相关概念,从而在第一次看到新类别的物体时,就能认出其类别。为了使图像物体分类模型拥有和人类一样的知识学习能力,可以根据其他模态的知识识别从未见过的图像物体,摆脱模型对大规模图像数据集的依赖,研究者提出了零样本学习问题。在零样本学习问题的任务设定中,图像数据集被划分为已知类别和未知类别,要求图像物体分类模型在只使用已知类别图像训练的情况下,实现对未知类别图像的分类。 解决零样本学习问题的关键是在未知类别图像训练样本缺失的情况下,如何利用辅助信息中的语义知识指导视觉图像的特征学习,实现跨模态的知识迁移。对此,本文分别在零样本学习的图像端和语义端围绕跨模态的知识迁移问题开展了深入研究。本文主要研究内容和取得的创新性成果包括:
|
语种 | 中文 |
页码 | 108 |
源URL | [http://ir.ia.ac.cn/handle/173211/39849] ![]() |
专题 | 毕业生_博士学位论文 |
通讯作者 | 贾真 |
推荐引用方式 GB/T 7714 | 贾真. 基于视觉和语义特征增强的零样本学习研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。