基于知识对齐与蒸馏的持续学习方法研究
文献类型:学位论文
作者 | 李焜炽![]() |
答辩日期 | 2024-05-16 |
文献子类 | 博士 |
关键词 | 持续学习 灾难性遗忘 知识对齐 级联的知识蒸馏框架 一对多信息匹配 |
英文摘要 | 实现通用人工智能的一个关键是构建的人工智能系统能够像人类一样灵活高效地持续学习新知识,并迅速适应动态变化的现实环境。但是,基于静态封闭的学习环境的假设导致当前基于数据驱动的人工神经网络在学习新任务时无法保留和积累先前学到的知识,也无法将这些知识应用于未来学习中。这种现象被称为人工神经网络的灾难性遗忘,即在学习新任务时遗忘先前的记忆。在持续学习的情境下,新任务数据通常与智能系统之前学习的旧数据是非独立同分布的。这表示新数据的分布、特征或关系可能与之前学习的数据有明显不同。由于旧模型仅在过去的任务上进行过训练,并且没有接触过新数据,因此其学到的表示缺乏适应性以容纳这些新数据。这种不足导致模型更新时会出现显著的表示漂移,进一步恶化了灾难性遗忘问题。为了解决这个问题,本研究致力于动态地提升模型学到的表征对新数据的适应能力,实现新旧类别表征的对齐,以减少任务之间的差异,进而缓解模型在学习新任务后出现的特征漂移,从而减轻灾难性遗忘。通过处理不断变化的非平稳数据流中新数据与旧数据之间的差异,智能系统能更好地应对现实世界中的变化,并持续学习新知识,从而提升系统的持续学习性能和对开放环境的适应性。本文的主要工作和创新点如下: (1) 本文首先分析了在非独立同分布的新旧数据中存在的知识差异,以及这种差异对持续学习方法整体表现造成的不良影响。针对这个问题,本文分析和借鉴人类儿童持续学习的行为过程,提出了一个包含三个训练阶段的框架。首先,通过图片与特征混合回放的方法结合知识蒸馏技术训练一个特征校准网络,以生成一个知识对齐后的教师网络;然后,使用不同基于知识蒸馏的持续学习方法在学习新任务的同时将校准后的旧任务知识从这个教师网络传递到新模型;最后,应用特征调整技术更新存储的旧任务的特征数据。由于第1和2阶段均使用了知识蒸馏技术,因此该方法形成了一个级联的知识蒸馏框架。实验结果表明,本研究的主要方法在三个数据集上取得了当时最优的表现,验证了通过知识对齐可以显著提高知识传递的效果。此外,级联的知识蒸馏框架被证明是一个通用的学习框架,适用于主流的基于知识蒸馏的持续学习方法,能够显著改善它们的整体性能。这一发现为我们研究持续学习提供了重要的指导和启示。 (2) 级联的知识蒸馏框架仅仅使用了从旧模型中提取的特征作为特征校准网络的输入。在旧模型无法很好泛化新旧类别的情况下,这种做法会影响知识对齐效果,从而影响持续学习的整体表现。为了解决这一问题并且减少训练阶段以节省训练时间和资源,本文提出了融合动态模型和块状知识蒸馏的改进方法。改进后的框架包括两个训练阶段。首先,在第1阶段,本文训练一个扩展模块,用于识别新旧类别。该模块有助于发现旧模型遗漏或者错过的属于旧类别但区别于新类别的关键特征。本文利用这些被遗漏的特征来校准旧类别的表示,增强对旧类别表示的泛化能力。接下来,在第2阶段,本文采用提出的块状知识蒸馏方法,结合长尾数据学习的技术,在学习新类别的同时将校准后的旧任务知识传递到新模型。块状知识蒸馏方法根据类别样本数将$softmax$层分成多个块,并进行分块蒸馏。由于每个块中的类别频率相同或相似,所以块内的$softmax$输出之间没有或只有很少的偏差。这可以为旧类别和新类别提供平衡的监督信息,有效解决数据不平衡问题。通过广泛的实验验证,本文提出的改进框架被证实显著提高了原方法的性能,在四个持续学习基准测试数据集上取得了当前最先进的表现。特别是在类增量平均准确率方面,该方法比当前最新的方法提高了1.2%至19.0%。 (3) 传统的知识蒸馏方法采用一对一的信息匹配来计算蒸馏损失。在持续学习旧任务样本不足以及高度数据不平衡的情况下,该方法会导致决策边界偏向新任务。为此,本文提出了基于数据混合的一对多信息匹配方法。该方法首先通过基于数据混合的数据增强方法得到混合数据。然后,它解耦混合数据及其相应的监督信息,更加强调对旧类别的重视。它优先将由旧类别样本计算得到的监督信息分配给混合数据,这相当于将这些混合样本视为旧类别的训练样本,同时意味着将旧类别决策边界推向新类别以包含这些混合数据,从而扩展了旧类别的决策边界,缓解了这个问题。实验结果表明该方法在四个持续学习基准测试数据集上取得了最优的性能,并且可以与前面提出的融合特征增强校准与块状蒸馏的级联知识蒸馏框架结合,在四个数据集上将类增量平均准确率提高了2.2%至4.7%。 |
学科主题 | 人工智能 |
语种 | 中文 |
页码 | 140 |
源URL | [http://ir.ia.ac.cn/handle/173211/57245] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 李焜炽. 基于知识对齐与蒸馏的持续学习方法研究[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。