中国科学院机构知识库网格系统: 检索

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

机构

采集方式

内容类型

发表日期

学科主题

筛选

浏览/检索结果: 共2条，第1-2条

帮助

条数/页：排序方式：
	Dynamic-horizon model-based value estimation with latent imagination 期刊论文 OAI收割 IEEE Transactions on Neural Networks and Learning Systems, 2022, 页码: 1-14 作者: Wang JJ(王俊杰); Zhang QC(张启超); Zhao DB(赵冬斌) \| 收藏 \| 浏览/下载：5/0 \| 提交时间：2023/05/30 Latent world model model-based value expansion (MVE) reinforcement learning reinforcement learning
	Multiagent Reinforcement Learning:Rollout and Policy Iteration 期刊论文 OAI收割 IEEE/CAA Journal of Automatica Sinica, 2021, 卷号: 8, 期号: 2, 页码: 249-272 作者: Dimitri Bertsekas \| 收藏 \| 浏览/下载：22/0 \| 提交时间：2021/04/09 Dynamic programming multiagent problems neuro-dynamic programming policy iteration reinforcement learning, rollout