图像识别中的领域泛化问题研究
文献类型:学位论文
作者 | Liu Geng |
答辩日期 | 2023-06-20 |
文献子类 | 硕士 |
关键词 | 深度学习 图像识别 领域泛化 开集识别 |
英文摘要 | 深度学习已经在计算机视觉和自然语言处理等领域内取得了很大的进展,但是传统的深度学习模型在面对域偏移,即测试数据与训练数据的分布差异较大的情况时,其性能往往会出现严重的下降。针对这个问题,有大量的领域泛化(Domain Generalization, DG)方法被提出,尝试将在多个源域上训练的模型泛化到未知的目标域上。本文针对经典的领域泛化问题以及更加困难且贴近实际的开集领域泛化问题进行了研究,提出了新颖的方法来提升模型的性能,并在多个领域泛化数据集上进行了系统的测试评估。本文的主要研究成果如下: 1. 针对当前领域泛化任务中存在的训练数据的领域多样性不足的问题,本文提出了一种基于大规模视觉语言预训练模型的文本引导的领域泛化方法,通过引入额外的文本信息来增强训练数据的领域多样性,进而提升模型的泛化性。 2. 目前已有大量的领域泛化方法被提出来增强模型的泛化性,减少域偏移对模型的影响从而提升模型在未知测试域上的性能。然而传统的领域泛化方法都基于训练数据与测试数据的类别空间一致的假设,这个假设在现实中常常无法成立,因此本文进一步研究了在训练数据与测试数据的类别空间不一致情况下的开集领域泛化问题。本文提出了基于孪生网络的开集领域泛化框架,该框架通过对原始训练图像进行分块打乱来构建合理的未知类别数据,把其作为负样本来不断地对模型进行负面监督,以此让模型学到真正关键的特征表达。这样的做法减少了模型对于原始训练数据的过拟合,有效抑制了模型的过度自信问题,进而增强了模型在开集领域泛化任务上的性能。实验结果显示,该框架在两个开集领域泛化数据集上均取得了目前最佳的性能表现。 |
学科主题 | 模式识别 |
语种 | 中文 |
页码 | 76 |
源URL | [http://ir.ia.ac.cn/handle/173211/52317] |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | Liu Geng. 图像识别中的领域泛化问题研究[D]. 2023. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。