中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向多智能体协作的注意力意图与交流学习方法

文献类型:期刊论文

作者俞文武; 杨晓亚; 李海昌; 王瑞; 胡晓惠
刊名自动化学报
出版日期2023
卷号49期号:11页码:2311-2325
关键词多智能体 强化学习 意图交流 注意力机制
ISSN号0254-4156
DOI10.16383/j.aas.c210430
英文摘要对于部分可观测环境下的多智能体交流协作任务,现有研究大多只利用了当前时刻的网络隐藏层信息,限制了信息的来源.研究如何使用团队奖励训练一组独立的策略以及如何提升独立策略的协同表现,提出多智能体注意力意图交流算法(Multi-agent attentional intention and communication, MAAIC),增加了意图信息模块来扩大交流信息的来源,并且改善了交流模式.将智能体历史上表现最优的网络作为意图网络,且从中提取策略意图信息,按时间顺序保留成一个向量,最后结合注意力机制推断出更为有效的交流信息.在星际争霸环境中,通过实验对比分析,验证了该算法的有效性.
源URL[http://ir.ia.ac.cn/handle/173211/55787]  
专题自动化研究所_学术期刊_自动化学报
推荐引用方式
GB/T 7714
俞文武,杨晓亚,李海昌,等. 面向多智能体协作的注意力意图与交流学习方法[J]. 自动化学报,2023,49(11):2311-2325.
APA 俞文武,杨晓亚,李海昌,王瑞,&胡晓惠.(2023).面向多智能体协作的注意力意图与交流学习方法.自动化学报,49(11),2311-2325.
MLA 俞文武,et al."面向多智能体协作的注意力意图与交流学习方法".自动化学报 49.11(2023):2311-2325.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。