中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于高斯过程和 Koopman 算子的模型预测控制

文献类型:学位论文

作者张金 鑫
答辩日期2024-08-23
文献子类博士
关键词机器人控制,机器学习,模型预测控制,高斯过程,Koopman 算子,深 度学习,非线性系统
英文摘要

模型预测控制能够系统地处理多输入多输出系统的控制问题,并具有最优 控制(准确地来讲为次最优控制)的特性,尤其是能够明确地处理被控系统的状 态约束和输入约束。这些优点使得模型预测控制成为各个科学与技术领域备受 关注的控制方法,尤其吸引机器人领域的关注。然而,模型预测控制面临两个主 要挑战需要解决。首先,模型预测控制的性能高度依赖于准确的系统模型,但在 实际应用中,被控系统的模型通常是未知的或只能通过有限数据集进行近似。这 限制了传统模型预测控制在复杂实际环境中的应用,特别是对于机器人等系统 的应用。其次,许多实际系统是非线性的,而非线性模型预测控制的计算复杂度 高,这严重阻碍了模型预测控制在机械臂这类快速系统实时控制中的应用。本论 文利用机器学习领域的高斯过程与 Koopman 算子这两种方法来解决模型预测控 制的上述两个主要问题,从而推动其在机器人领域的广泛应用和进一步发展。

本论文第一部分致力于解决上述提及的第一个主要问题。为了得到合理的 理论结果,本部分研究专注于具有状态约束和输入约束的 Lipschitz 时不变非线 性系统。针对这类系统,本部分研究的主要假设是:首先,假设除了已知系统 的某些洞察(如系统的 Lipschitz 连续性),缺乏对其物理机理的深入认知,难以 通过传统的物理学原理对其进行建模;其次,假设可以通过从系统中获取相关 的数据集来推断其行为。本部分研究将模型预测控制与高斯过程结合形成了一 个完整的数据驱动控制框架,并且提出了具有理论保证的 Gaussian Process-based Predictive Control(G2PC)算法。所提出的 G2PC 算法具有如下优势:首先,高斯 过程的非参数建模特性可以使其对各种实际系统进行灵活建模,从而使得 G2PC 算法适用于多种非线性系统;第二,G2PC 允许将对系统的已有洞察整合到高斯 过程的协方差函数类型和其超参数先验值的选择中,这些选择具有明确的物理 意义,从而提高了该算法的效率和性能;第三,该算法将高斯过程提供的协方差 信息包含进了模型预测控制的目标函数中,这样的设计可以使被控系统有效避 开模型不确定区域,从而提高了系统控制的稳定性和鲁棒性。本部分研究的另一 个重要贡献是在合理的假设条件下,利用高斯过程的期望函数和协方差函数的 特性,证明了 G2PC 算法的迭代可行性;此外,通过设计新颖的双层终态约束区 域,进一步证明了所提出算法的闭环稳定性,从而在理论上确保了 G2PC 算法的 有效性和可行性。最后通过一个标准的仿真实验验证了该方法的有效性。

尽管第一部分提出的 G2PC 算法能够解决模型预测控制的第一个主要问题, 但在面对大量训练数据或高维系统时,其计算复杂度显著增加,限制了其应用。 因此,本论文的第二部分内容采用基于 Koopman 算子的数据驱动建模方法,旨 在同时解决模型预测控制的上述两个问题。具体而言,本部分针对模型未知的机 械臂系统,首先提出了新颖的结构化深度 Koopman 模型,然后进一步提出了基 于该模型的模型预测控制算法,从而解决了具有状态约束和输入约束的机械臂 系统的实时控制问题。本部分研究的主要贡献为:首先,Koopman 算子可将状态 空间中的非线性动力学提升为观测函数空间中的全局线性化模型,本部分研究 在此基础上进一步结构化该全局线性化模型,提高了模型的精确性;第二,引入 了新颖的 Lipchitz 深度神经网络来学习相关 Koopman 算子的观测函数,有效降 低了 Koopman 空间的状态维数;第三,在理论上证明了采用 Lipchitz 深度神经 网络的合理性,特别是证明了 Lipchitz 函数空间是与机械臂系统相关的 Koopman 算子的不变子空间;第四,提出的结构化深度 Koopman 模型为基于 Koopman 算 子的模型提供了一种新的观察视角——动态补偿的视角,统一了传统的局部线 性化模型和全局线性化模型;第五,基于该模型的模型预测控制算法能够实现机 械臂系统的实时控制;最后,通过仿真和硬件实验验证了所提出方法的有效性。

尽管第二部分提出的基于 Koopman 算子的模型预测在实际机械臂系统中展 现出有效性,但是缺乏对 Koopman 算子更深入的数学分析。此外,第二部分所 提算法需要高性能 GPU 才可满足 Koopman 状态提升的实时性,这限制了该算 法在计算资源有限时的应用。因此,本论文的第三部分内容进一步拓展和深化 Koopman 算子的理论研究,并在此基础上提出了基于 Lie 代数的 Koopman 算法, 该算法减少了对 GPU 资源的依赖。本部分的主要贡献为:首先,将 Koopman 算 子的方法推广到光滑(或可微)流形上的控制仿射非线性动力学系统,并阐述 了该动力学系统的 Koopman 算子半群是强连续单参数半群(即  0-半群),进一 步证明了其 Koopman 生成子等价于该流形上的函数的 Lie 导数;其次,第二部 分已证明了 Lipschitz 函数空间是与机械臂系统相关的 Koopman 算子的不变子空 间,本部分研究进一步从理论上讨论 Koopman 不变子空间,描述了其多个不变 子空间,并探讨了当 Koopman 算子作用在何种不变子空间时,该 Koopman 算 子能够完全恢复原始系统动力学。第三,本部分研究继续探讨了在何种情况下 Koopman 算子可以将流形上的控制仿射非线性系统双线性化甚至严格全局线性 化,这些结果为利用 Koopman 算子进行系统控制提供了新的洞见和理论支持; 第四,提出了基于 Lie 代数的 Koopman 算法,并详细描述了构建其 Lie 代数观测函数的具体算法,该算法提高了控制的实时性;第五,第二部分研究使用深 度 Lipschitz 神经网络来获得相应的观察函数,本部分研究进一步从理论上证明 了深度神经网络的优势。具体地,证明了利用径向基函数神经网络学习观察函 数的 Koopman 算子等价于具有控制输入的增广动态模式分解。这一理论结果表 明,径向基函数神经网络这类浅层网络无法学习更高效的非线性观测函数,而深 度神经网络更深的层数能够使其学习到更复杂也更合理的非线性观测函数,从 而降低 Koopman 状态的维数并减轻模型预测控制的计算负担。

语种中文
页码136
源URL[http://ir.ia.ac.cn/handle/173211/59462]  
专题毕业生_博士学位论文
通讯作者张金 鑫
推荐引用方式
GB/T 7714
张金 鑫. 基于高斯过程和 Koopman 算子的模型预测控制[D]. 2024.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。