基于高维神经网络动力学的自监督学习理论研究
文献类型:学位论文
作者 | 孟令寰![]() |
答辩日期 | 2024-05-26 |
文献子类 | 硕士 |
关键词 | 自监督学习 神经网络动力学 高维分析 非线性对比学习模型 |
英文摘要 | 自监督学习作为一种利用海量无标记数据进行特征学习的重要方法,在计 算机视觉和自然语言处理等领域取得了广泛成功。然而,目前自监督学习缺乏统 一的理论框架,对于泛化保证、公平性、鲁棒性等方面的理论解释和分析尚显不 足。本文基于神经网络动力学的方法,致力于面对这些挑战。本文从描绘特征空 间的角度出发,尝试解释自监督学习方法,并通过实验证实了关键技术的有效 性,包括超参数调节、投影网络、指数滑动平均和梯度停止等。同时,本文对单 层非线性对比学习模型的训练动态进行了高维分析,发现了一些有意义的现象, 为自监督学习中的理论问题提供了新的思路和方法。 本文的主要工作包括对单层非线性对比学习模型的训练动态进行了高维分 析。本文发现模型权重的经验分布收敛于由McKean-Vlasov 非线性偏微分方程 决定的确定性度量函数。在L2正则化条件下,该偏微分方程简化为一组封闭的 低维常微分方程,反映了训练过程中模型性能的演变。本文进一步分析了常微分 方程的定点位置及其稳定性,发现了一些有趣的现象,例如隐藏变量的第二矩会 影响特征可学性,更高阶矩会通过控制吸引区域影响特征选择的概率。最后,本 文提出了两种基于理论分析的实验方法:基于互相关约束的自监督方法和相关 高斯噪声增强,并通过实验证明了它们的有效性。 综上所述,本文的研究对理解和应用自监督学习具有重要意义,为解决自监 督学习中的理论难题提供了新的思路和方法。 |
语种 | 中文 |
页码 | 104 |
源URL | [http://ir.ia.ac.cn/handle/173211/56734] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 孟令寰. 基于高维神经网络动力学的自监督学习理论研究[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。