中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [3]
采集方式
OAI收割 [3]
内容类型
期刊论文 [2]
学位论文 [1]
发表日期
2015 [3]
学科主题
筛选
浏览/检索结果:
共3条,第1-3条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
连续状态系统的近似最优在线强化学习
学位论文
OAI收割
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:
朱圆恒
收藏
  |  
浏览/下载:184/0
  |  
提交时间:2015/09/02
强化学习
最优控制
近似策略迭代
概率近似最优
连续状态系统
收敛性
在线学习
kd树
Reinforcement learning
optimal control
approximate policy iteration
probably approximately correct
continuous-state system
convergence
online learning
kd-tree
A data-based online reinforcement learning algorithm satisfying probably approximately correct principle
期刊论文
OAI收割
NEURAL COMPUTING & APPLICATIONS, 2015, 卷号: 26, 期号: 4, 页码: 775-787
作者:
Zhu, Yuanheng
;
Zhao, Dongbin
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2015/09/21
Reinforcement learning
Probably approximately correct
Kd-tree
MEC-A Near-Optimal Online Reinforcement Learning Algorithm for Continuous Deterministic Systems
期刊论文
OAI收割
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2015, 卷号: 26, 期号: 2, 页码: 346-356
作者:
Zhao, Dongbin
;
Zhu, Yuanheng
收藏
  |  
浏览/下载:40/0
  |  
提交时间:2015/09/18
Efficient exploration
probably approximately correct (PAC)
reinforcement learning (RL)
state aggregation