中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
多尺度神经可塑性启发的脉冲神经网络学习算法研究

文献类型:学位论文

作者程翔
答辩日期2024-08-13
文献子类博士
关键词类脑智能 神经可塑性 脉冲神经网络
英文摘要

      近年来,深度学习在人工智能领域取得了显著成就,但作为其核心的人工神经网络仍面临鲁棒性、通用性、能量消耗和连续学习等问题的挑战。解决这些问题的一个途径是借鉴脑中高效的信息处理机制来启发新型人工神经网络设计。其中,脉冲神经网络是一种神经元节点更加生物合理化的人工神经网络,其内在动力学、阈值放电、稀疏活动的特点带来了动态信息处理、鲁棒性、推理能耗等层面的潜在优势。当前脉冲神经网络学习算法研究存在对神经元动力学关注不足,以及缺少生物合理的全局信息指导方式这两大问题。为了解决这两个问题,本文对四类多尺度神经可塑性现象进行机制建模,在以模式分类任务作为基础的多种范式上,对神经可塑性启发的学习算法在应用层面的优势开展研究。首先,本文受微观侧向作用现象的启发,对脉冲神经网络的鲁棒学习展开研究。随后,本文受微观神经元异质性现象的启发,对脉冲神经网络的灵活学习展开研究。然后,本文受介观可塑性传播现象的启发,对神经网络的高效学习展开研究。最后,本文受宏观神经调制现象的启发,对神经网络的连续学习展开研究。

      本文的主要研究成果总结如下:

      1. 微观侧向作用启发的脉冲神经网络鲁棒学习算法

      对于生物神经元的活动来说,神经元模型的内在动力学具有和突触连接强度相同的重要性。当前的人工和脉冲神经网络研究主要关注网络结构的复杂化,而忽视了计算单元复杂化的意义。受侧向作用启发,本文设计了具有更复杂空间动力学特性的神经元模型。该神经元模型将侧向作用建模为邻近神经元活动对膜电位的一种强度可学习的影响。模式分类任务上,具有侧向作用的网络具有更高的准确性。在Fashion-MNIST数据集上,侧向作用的引入使得网络以一个较为简单的结构获得了当时最高的准确率。在向测试数据添加噪声后,具有侧向作用的网络表现出更小的准确性衰减。由此可见,侧向作用机制通过强化特征和抑制噪声,提升了网络对噪声的鲁棒性。通过这一工作,本文初步建立了由生物机制到应用场景的类脑算法研究的方法论,为本文的后续工作打下了基础。

      2. 微观神经元异质性启发的脉冲神经网络灵活学习算法

      通过引入时序上更为复杂的二维非线性动力学,本文设计了具有发放模式异质性的神经元模型,并进一步地研究了神经元异质性活动与网络性能间的关联。多类数据集上的实验结果表明,动力学特性的差异所产生的不同发放模式可以体现在网络的分类性能之中。此外,混合多类神经元构成的网络能够在不同数据集上同时表现出准确性优势。传统神经网络研究倾向于通过复杂的结构设计来实现不同任务上的应用,而实验结果表明,神经元节点的复杂动力学同样可以成为实现此目标的途径。总的来说,神经元模型的动力学机制虽然不像突触可塑性规则一样直接作用于突触权重,但是能够通过神经活动间接影响学习过程,神经元模型的复杂性表现出了对脉冲神经网络学习过程的重要意义。

      3. 介观可塑性传播启发的神经网络高效学习算法

      当前神经可塑性启发的学习算法依赖局部活动修改突触权重,存在难以利用全局反馈信号的问题,因而性能落后于反向传播等先进学习算法。可见,神经系统中存在的多类全局信号传递方式尚未与人工模型很好地结合。生物实验中观察到的可塑性传播现象就是其中一种。基于神经元内分子调制信号的天然逆向传递,输出突触处产生的长时程可塑性可以逆向传播至输入突触并引发输入突触处的长时程可塑性。据此,本文提出了人工和脉冲神经网络中的自组织反向传播(self-backpropagation,SBP)算法。该算法是一个自组织反向传播机制和现有学习算法的组合算法。同时,本文提出了一个综合考虑算法复杂度和迭代次数的训练能耗评估指标,进而剖析了传统人工和脉冲神经网络训练算法的高能耗问题。在脉冲神经网络中,自组织反向传播算法和脉冲时序依赖可塑性(spiking-timing-dependent plasticity,STDP)、短时程可塑性等局部算法共同优化隐藏层的突触权重。在准确性有所提升的同时,网络的训练能耗也比不引入自组织反向传播的训练过程更低。在人工神经网络中,自组织反向传播算法部分替换隐藏层中的反向传播算法。在保证准确性不降低的同时,网络观察到了与脉冲神经网络中类似的训练能耗降低的现象。这一实验结果表明,脑的高效学习能力依赖于多类型多尺度可塑性机制的组合,生物启发的学习算法也需要关注更多尺度的神经可塑性现象间的有机组合。

      4. 宏观神经调制启发的神经网络连续学习算法

      SBP的实验结果初步证明,全局信息传递机制有可能缓解局部活动依赖的学习算法在准确性上的缺陷,并保留其训练能耗的优势。此外,本文对一种宏观的全局信号传递方式,即神经调制,如何应用于学习算法设计展开研究。在神经调质系统中,多巴胺等化学物质在外界奖惩信号的作用下,由特定通路释放到靶点脑区并广泛影响其中的多种神经活动。本文关注了神经调制对神经活动的两类作用。一方面,神经调质与突触上受体的结合不仅可以直接影响突触强度,还可以通过对可塑性规则产生影响进而间接影响突触强度。这种可塑性的可塑性被称为“元可塑性”。本文在人工和脉冲神经网络中建模了这种元可塑性并验证了其与SBP类似的高效学习特性。算法中,输入信息的类别和输出的误差分别作为隐藏层和输出层的全局信号,通过预生成的神经调制矩阵决定突触处的神经调质水平进而得到神经调制对可塑性的影响。除了准确性和训练能耗的优势外,该算法还能够实现与前向传播并行的隐藏层学习而无需网络误差的反馈指导,因而减少了对中间变量存储的依赖并表现出作为硬件在线学习算法的潜力。另一方面,本文以一种掩蔽的形式对神经元兴奋性的调制进行建模。实验结果表明,同时对突触和神经元进行的神经调制能够减轻类别连续学习任务上的灾难性遗忘问题。该过程中权重修改量的分布表明,与局部的STDP和全局的反向传播算法不同,神经调制现象启发的学习算法下,权重修改量近似于正态分布,且大多数权重修改量的幅度接近于零。因此,神经调制启发的学习算法表现出稀疏学习的特点,这很可能是其具有缓解灾难性遗忘能力的原因。

语种中文
页码128
源URL[http://ir.ia.ac.cn/handle/173211/58833]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
程翔. 多尺度神经可塑性启发的脉冲神经网络学习算法研究[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。