肌肉骨骼机器人神经启发式分层运动学习研究
文献类型:学位论文
作者 | 周俊杰![]() |
答辩日期 | 2022-05-23 |
文献子类 | 博士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 乔红 |
关键词 | 肌肉骨骼机器人系统 神经启发式算法 分层运动学习 行为决策 |
学位名称 | 工学博士 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 肌肉骨骼机器人系统是具有刚柔耦合特性的复杂系统,其与关节-连杆型机器人系统最显著的区别在于前者采用冗余、柔性的肌肉模块作为驱动器。冗余肌肉的引入从结构上实现了运动的安全性、柔顺性和可靠性,为机器人在复杂环境和困难任务中的运动能力提供了保障。然而,特殊的肌肉结构和动力学特性在带来结构和功能潜在优势的同时,也引入了肌肉骨骼系统特有的强非线性、高冗余性和强耦合性。这些特性不仅使得传统的机器人运动学习方法在这类系统上难以实现类人的高效运动学习和行为调控能力,还阻碍了肌肉骨骼机器人类人运动学习的进一步研究与探索。 针对肌肉骨骼机器人系统实现类人运动学习能力的困难,本文受大脑皮层、基底神经节等神经环路的运动调控机制启发,围绕系统的运动训练困难、任务适应困难、复杂任务下行为调控困难,开展了系列研究,提出了基于任务分层、运动分层和策略分层架构的三类运动学习模型。论文的主要工作和创新点归纳如下: 1. 肌肉骨骼机器人系统的高效运动学习能力是其形成更高级智能行为的关键。本研究受生物认知学习过程中的逐次近似认知机制和内侧前运动皮层神经元知觉决策编码机制启发,建立了引入逐次近似学习机制的肌肉骨骼机器人分层运动学习算法模型,利用任务分层机制提高了肌肉骨骼机器人系统运动学习效率。首先,在任务分层计算模型的设计上,本研究根据期望目标状态与学习进度,构造了一系列不同难度层次的简化目标状态,实现了对运动学习过程的引导,有效降低了由肌肉特性导致的奖励长期信度分配困难对运动学习的不利影响,提高了运动学习效率。其次,在肌肉信号调制模型的构建中,通过模拟内侧前运动皮层神经元知觉决策编码机制,本研究将具有计算复杂度优势的离散域运动学习算法成功扩展到连续域,大幅缓解了肌肉刺激信号在复杂、高维解空间中的求解困难。本研究在包含4条肌肉、2个自由度的手臂模型上开展了实验,验证了任务分层机制对学习过程的引导作用,实现了肌肉骨骼机器人快速且稳定的运动学习。 2. 在多变的任务要求下对熟练运动技能进行灵活、鲁棒的调节,是生物行为适应能力的体现。本研究受皮层-基底神经节环路运动调控机制启发,将运动生成过程分为“信息感知-行为规划-运动执行”三个阶段,提出了一种实现任务-运动解耦的分层运动学习算法,通过运动分层机制增强了肌肉骨骼机器人系统对不确定任务的适应能力。在信息感知阶段,根据基底神经节决策机制和菲兹法则,结合机器人运动任务需求,本研究建立了主动式的速度-精度权衡模型。在行为规划阶段,本研究参考纹状体中间神经元环路的差分速度调制机制,提出了一种具有钟形特征的速度调制模型,以计算平滑的动作轨迹。在运动执行阶段,本研究在确定性策略模型中引入了状态监督信号与肌肉骨骼系统特有的拮抗肌先验结构特征,建立了不依赖具体任务的肌肉协同收缩策略模型,实现了对冗余肌肉间协同模式的学习,促进了冗余肌肉之间任务通用的合作,提高了系统对不确定任务要求的运动适应能力。本研究在包含12条肌肉和3个自由度的复杂肌肉骨骼手臂模型上进行了实验,验证了肌肉协同收缩策略的鲁棒性与任务适应能力。 3. 在非稳态决策运动任务中,使用单一行为策略通常不能实现最好的运动性能。这类任务通过要求算法模型在时间或空间层面对多个行为策略进行灵活调度,以反映生物运动学习的智能性。本研究受基底神经节尾状核对自动行为和自愿行为的分层调控机制启发,提出了一种融合了统计决策理论与强化学习理论的分层策略运动学习模型,通过策略分层机制增强了机器人在复杂非稳态决策任务中的行为调控能力。首先,针对自动行为策略偏好的不确定性问题,基于次优经济决策理论和注意力地势模型,本研究建立了基于前向视角决策的最简自动行为策略模型,实现了行为偏好的策略化表示。其次,本研究结合苍白球脑区的行为价值预测评估机制与改进的基底神经节决策模型,建立了基于后向视角决策的自愿行为策略模型,克服了在非稳态、连续情况下的决策困难。最后,通过将策略分层融合,本研究实现了机器人运动过程中对“最有利”决策和“最可信”决策的兼顾。实验中,本研究在包含3个自由度的手臂模型上进行了实验,验证了策略分层模型不仅能稳定习得具有明确语义特性的自动行为策略,而且能通过策略的时序组合实现优于单一策略的运动性能,体现出良好的行为调控能力。 |
语种 | 中文 |
页码 | 162 |
源URL | [http://ir.ia.ac.cn/handle/173211/48576] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 周俊杰. 肌肉骨骼机器人神经启发式分层运动学习研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。