中国科学院机构知识库网格系统: 二人零和动态博弈的自学习平行控制方法研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

二人零和动态博弈的自学习平行控制方法研究

文献类型：学位论文


作者	朱振华
答辩日期	2023-11-30
文献子类	硕士
关键词	自适应动态规划平行控制零和博弈
英文摘要	随着游戏智能、智能空战和自动驾驶等领域的发展，二人零和动态博弈问题的研究得到了广泛的关注。以模型预测控制和自适应动态规划为代表的经典工作往往假设系统的状态方程已知或者可以近似，当系统比较复杂难以精确建模时，仅使用上述方法难以处理。以人工系统+计算实验+平行执行为核心的平行控制是解决复杂系统建模、分析和控制的有效方法，本文研究一种基于自适应动态规划的自学习平行控制方法求解和分析二人零和动态博弈问题，本文的主要工作如下：（1）针对实际系统为时变非线性系统且无精确数学模型的二人零和动态博弈问题，本工作研究以实际系统和分时多人工系统为平行系统的自学习平行控制方法。本工作构造了分时多人工系统；分析了单个人工系统计算实验中的迭代值函数和迭代控制律的收敛性以及多人工系统值函数的收敛性；提出了判断人工系统上获得的控制律对实际系统是否有效的准则，并在该准则下分析实际系统性能指标函数的收敛性。（2）针对从实际系统当中获取状态数据困难且成本高并且存在与实际系统相对应的简化数学模型不完全精准的场景，本工作在上述工作的基础上，研究以实际系统、简化数学模型和分时多人工系统为平行系统的自学习平行控制方法。本工作提出了一个基于简化数学模型来构造人工系统的方法；分析了简化数学模型计算实验中迭代值函数和迭代控制律的收敛性；分析了人工系统计算实验中迭代值函数的收敛性以及多人工系统值函数的收敛性；提出了选择简化数学模型和人工系统中与实际系统进行平行执行的系统的准则，并在该准则下分析了实际系统的性能指标函数的收敛性。
语种	中文
页码	85页
源URL	[http://ir.ia.ac.cn/handle/173211/54186]
专题	毕业生_硕士学位论文自动化研究所_复杂系统管理与控制国家重点实验室_智能化团队自动化研究所_毕业生中国科学院自动化研究所
推荐引用方式 GB/T 7714	朱振华. 二人零和动态博弈的自学习平行控制方法研究[D]. 2023.

入库方式： OAI收割

来源：自动化研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。