中国科学院机构知识库网格系统: 检索

浏览/检索结果: 共4条，第1-4条

帮助

条数/页：排序方式：
	Online Minimax Q Network Learning for Two-Player Zero-Sum Markov Games 期刊论文 OAI收割 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 卷号: 33, 期号: 3, 页码: 1228-1241 作者: Zhu, Yuanheng; Zhao, Dongbin \| 收藏 \|
	Multiagent Adversarial Collaborative Learning via Mean-Field Theory 期刊论文 OAI收割 IEEE TRANSACTIONS ON CYBERNETICS, 2021, 卷号: 51, 期号: 10, 页码: 4994-5007 作者: Luo, Guiyang; Zhang, Hui; He, Haibo; Li, Jinglin; Wang, Fei-Yue \| 收藏 \|
	Nash Q-learning based equilibrium transfer for integrated energy management game with We-Energy 期刊论文 OAI收割 NEUROCOMPUTING, 2020, 卷号: 396, 页码: 216-223 作者: Yang, Lingxiao; Sun, Qiuye; Ma, Dazhong; Wei, Qinglai \| 收藏 \|
	FMRQ-A Multiagent Reinforcement Learning Algorithm for Fully Cooperative Tasks 期刊论文 OAI收割 IEEE TRANSACTIONS ON CYBERNETICS, 2017, 卷号: 47, 期号: 6, 页码: 1367-1379 作者: Zhang, Zhen; Zhao, Dongbin; Gao, Junwei; Wang, Dongqing; Dai, Yujie \| 收藏 \|