中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [2]
采集方式
OAI收割 [2]
内容类型
期刊论文 [2]
发表日期
2022 [1]
2021 [1]
学科主题
筛选
浏览/检索结果:
共2条,第1-2条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
发表日期升序
发表日期降序
题名升序
题名降序
作者升序
作者降序
Dynamic-horizon model-based value estimation with latent imagination
期刊论文
OAI收割
IEEE Transactions on Neural Networks and Learning Systems, 2022, 页码: 1-14
作者:
Wang JJ(王俊杰)
;
Zhang QC(张启超)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2023/05/30
Latent world model
model-based value expansion (MVE)
reinforcement learning
reinforcement learning
Multiagent Reinforcement Learning:Rollout and Policy Iteration
期刊论文
OAI收割
IEEE/CAA Journal of Automatica Sinica, 2021, 卷号: 8, 期号: 2, 页码: 249-272
作者:
Dimitri Bertsekas
  |  
收藏
  |  
浏览/下载:22/0
  |  
提交时间:2021/04/09
Dynamic programming
multiagent problems
neuro-dynamic programming
policy iteration
reinforcement learning, rollout