面向博弈对抗的智能量化评估方法研究
文献类型:学位论文
作者 | 牟佳![]() |
答辩日期 | 2021-06 |
文献子类 | 硕士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 刘禹 |
关键词 | 博弈对抗 时序空间特性 智能量化评估 深度学习 时序频繁项挖掘 |
学位名称 | 工学硕士 |
学位专业 | 计算机应用技术 |
英文摘要 | 近年来人工智能技术的发展,给很多问题带来了全新的解决思路,以人机对抗形式出现的博弈对抗问题受到了极大的关注,一部分研究者从AI智能体的角度出发,研究如何对博弈对抗环境态势进行有效认知,提高搜索算法的效率,以及如何针对态势采取动作;另一部分研究者从比赛组织者角度,研究如何对博弈对抗环境中的态势进行挖掘,探索比赛组织管理的多样化方式,增加比赛的观赏性与专业性。目前针对博弈对抗环境的认知与评估已成为了人工智能领域具备极大潜力的研究方向,尤其是在军事博弈对抗环境中,认知与评估是提升智能体指挥决策能力的关键。 本研究针对智能体战术运用能力高效学习和定性、量化评估的问题分别开展了基于战术描述数据挖掘的作战风格定性评估研究和基于深度学习的智能量化评估研究,通过在兵棋推演实战数据和公开数据集的实验验证证明本研究提出的方法切实有效。 在基于战术描述数据挖掘的作战风格定性评估研究中,本研究利用单算子频繁项特征挖掘与多算子协同动作特征挖掘共同实现了战场重要地物挖掘与智能体行为特性挖掘两个目标。针对单算子频繁项特征挖掘,本研究基于复盘数据设计了动作特征提取方案,采用WTH(who-type-how)形式对提取后的动作特征进行编码,选取了时序频繁项挖掘算法AprioriAll对复盘数据表现出的智能体行动习惯与特性进行提取。针对多算子协同动作特征挖掘,本研究根据陆战合同战术结合OODA循环理论设计了四类协同动作,对多算子协同下的战术行为进行标注,可以支撑非依赖军事知识的智能体利用高层次战术语义特征进行训练。对于挖掘出的智能体行为特征,分别采用了线性模型与谱聚类模型完成了智能体的能力归因与作战风格定性评估。 在基于深度学习的智能量化评估研究中,本研究基于智能体决策模式,即根据环境反馈信息动态调整策略的环境-策略交互模式,提出了智能量化评估框架,其对博弈对抗环境态势进行特征提取,并抽取多种效用信息构建了动态可重组的多元标签数据,结合深度学习设计了端到端的智能量化评估模型,最终对模型预估结果进行聚合分析,实现了对博弈对抗过程中智能体的综合表现进行量化评估的目标。进一步本研究基于多通道时序空间编码环境信息, 提出一种附带侧信息融合的卷积长短时记忆网络SideInfo-STNet。将该智能量化评估框架应用于战术级海军兵棋推演系统中,分析结果表明所得结果有极高的可信度,并能够获得启发式的结论。 本研究开展的面向博弈对抗的智能量化评估是基于博弈对抗过程对智能体表现的综合定性与量化评价,通过在战术级兵棋推演上进行实验,验证了本研究所提出的方案与框架都有极好的效果,能够从大量复盘数据中捕获到重要的信息以得到高解释性与高量化比较性的结论,进而有效地辅助智能体提升决策与行动等能力,这一点对军事博弈对抗尤为重要。 |
语种 | 中文 |
页码 | 69 |
源URL | [http://ir.ia.ac.cn/handle/173211/44795] ![]() |
专题 | 综合信息系统研究中心_脑机融合与认知评估 |
推荐引用方式 GB/T 7714 | 牟佳. 面向博弈对抗的智能量化评估方法研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2021. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。