中国科学院机构知识库网格系统: 检索

浏览/检索结果: 共4条，第1-4条

帮助

条数/页：排序方式：
	Resilience-driven maintenance scheduling methodology for multi-agent production line system 会议论文 OAI收割 27th Chinese Control and Decision Conference, CCDC 2015, Qingdao, China, May 23-25, 2015 作者: Wang X(王潇); Qi C(祁超); Wang HW(王洪伟); Si QM(佀庆民); Zhang GW(张国伟) 收藏 \| 浏览/下载：32/0 \| 提交时间：2015/11/18 resilience deteriorating quality states semi-Markov decision processes resource constraints multi-agent reinforcement learning
	On average reward semi-markov decision processes with a general multichain structure 期刊论文 OAI收割 MATHEMATICS OF OPERATIONS RESEARCH, 2004, 卷号: 29, 期号: 2, 页码: 339-352 作者: Jianyong, L; Xiaobo, Z \| 收藏 \| 浏览/下载：49/0 \| 提交时间：2018/07/30 semi-Markov decision processes average reward criterion multichain structure data-transformation method optimal policy
	马氏决策过程的递阶强化学习与灵敏度分析学位论文 OAI收割工学博士, 中国科学院自动化研究所: 中国科学院研究生院, 2001 作者: 王利存收藏 \| 浏览/下载：125/0 \| 提交时间：2015/09/02 强化学习马氏决策过程半马氏决策过程灵敏度分析递阶算法仿真 Reinforcement Learning Markov Decision Processes Semi-Markov Decision Processes Sensitivity Analysis Hierarchical Algorithm Sim
	Semi-infinite Markov decision processes 期刊论文 OAI收割 MATHEMATICAL METHODS OF OPERATIONS RESEARCH, 2000, 卷号: 51, 期号: 1, 页码: 115-137 作者: Chen, M; Filar, JA; Liu, K \| 收藏 \| 浏览/下载：22/0 \| 提交时间：2018/07/30 semi-infinite Markov decision processes optimal strategy epsilon-optimal