中国科学院机构知识库网格系统: 一种针对德州扑克AI的对手建模与策略集成框架

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

一种针对德州扑克AI的对手建模与策略集成框架

文献类型：期刊论文


作者	张蒙1,2 ; 李凯1,2 ; 吴哲1,2 ; 臧一凡 1,2; 徐航 1,2; 兴军亮1,2
刊名	自动化学报
出版日期	2021
期号	0 页码:0
关键词	不完美信息博弈德州扑克演化学习在线对手建模种群策略集成
文献子类	中文期刊
英文摘要	以德州扑克游戏为代表的大规模不完美信息博弈是现实世界中常见的一种博弈类型. 现有以求解纳什均衡策略为目标的主流德州扑克AI算法存在依赖博弈树模型、算力消耗大、策略过于保守等问题，导致智能体在面对不同对手时无法最大化自身收益. 为解决上述问题，本文提出一种轻量高效且能快速适应对手策略变化进而剥削对手的不完美信息博弈求解框架. 本框架分为智能体离线训练和在线博弈两阶段. 第一阶段基于演化学习思想训练智能体，得到能够剥削不同博弈风格对手的策略神经网络. 在博弈阶段中，智能体在线建模并适应未知风格对手，利用种群策略集成的方法最大化剥削对手. 在两人无限注德州扑克环境中的实验结果表明，本框架在面对动态对手策略时，相比已有方法能够大幅提升博弈性能.
语种	中文
源URL	[http://ir.ia.ac.cn/handle/173211/44868]
专题	智能系统与工程
通讯作者	兴军亮
作者单位	1.中国科学院大学 2.中国科学院自动化研究所
推荐引用方式 GB/T 7714	张蒙,李凯,吴哲,等. 一种针对德州扑克AI的对手建模与策略集成框架[J]. 自动化学报,2021(0):0.
APA	张蒙,李凯,吴哲,臧一凡,徐航,&兴军亮.(2021).一种针对德州扑克AI的对手建模与策略集成框架.自动化学报(0),0.
MLA	张蒙,et al."一种针对德州扑克AI的对手建模与策略集成框架".自动化学报 .0(2021):0.

入库方式： OAI收割

来源：自动化研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。