中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
数学与系统科学研究院 [2]
自动化研究所 [1]
沈阳自动化研究所 [1]
采集方式
OAI收割 [4]
内容类型
期刊论文 [2]
会议论文 [1]
学位论文 [1]
发表日期
2015 [1]
2004 [1]
2001 [1]
2000 [1]
学科主题
筛选
浏览/检索结果:
共4条,第1-4条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Resilience-driven maintenance scheduling methodology for multi-agent production line system
会议论文
OAI收割
27th Chinese Control and Decision Conference, CCDC 2015, Qingdao, China, May 23-25, 2015
作者:
Wang X(王潇)
;
Qi C(祁超)
;
Wang HW(王洪伟)
;
Si QM(佀庆民)
;
Zhang GW(张国伟)
收藏
  |  
浏览/下载:20/0
  |  
提交时间:2015/11/18
resilience
deteriorating quality states
semi-Markov decision processes
resource constraints
multi-agent reinforcement learning
On average reward semi-markov decision processes with a general multichain structure
期刊论文
OAI收割
MATHEMATICS OF OPERATIONS RESEARCH, 2004, 卷号: 29, 期号: 2, 页码: 339-352
作者:
Jianyong, L
;
Xiaobo, Z
  |  
收藏
  |  
浏览/下载:43/0
  |  
提交时间:2018/07/30
semi-Markov decision processes
average reward criterion
multichain structure
data-transformation method
optimal policy
马氏决策过程的递阶强化学习与灵敏度分析
学位论文
OAI收割
工学博士, 中国科学院自动化研究所: 中国科学院研究生院, 2001
作者:
王利存
收藏
  |  
浏览/下载:112/0
  |  
提交时间:2015/09/02
强化学习
马氏决策过程
半马氏决策过程
灵敏度分析
递阶
算法
仿真
Reinforcement Learning
Markov Decision Processes
Semi-Markov Decision Processes
Sensitivity Analysis
Hierarchical
Algorithm
Sim
Semi-infinite Markov decision processes
期刊论文
OAI收割
MATHEMATICAL METHODS OF OPERATIONS RESEARCH, 2000, 卷号: 51, 期号: 1, 页码: 115-137
作者:
Chen, M
;
Filar, JA
;
Liu, K
  |  
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2018/07/30
semi-infinite Markov decision processes
optimal strategy
epsilon-optimal