中国科学院机构知识库网格系统: 可重入生产系统的平均报酬型强化学习调度

文献类型：期刊论文


作者	沈志江; 于海斌; 柳长春
刊名	信息与控制
出版日期	2004
卷号	33 期号:2 页码:145-150
关键词	平均报酬型强化学习可重入系统调度暂态差分
ISSN号	1002-0411
其他题名	Average Reward Reinforcement Learning Scheduling of Closed Reentrant Production Systems
产权排序	1
英文摘要	在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优于两种熟知的优先权调度策略 .
语种	中文
CSCD记录号	CSCD:1618847
资助机构	国家自然科学基金资助项目 (699740 3 9)
公开日期	2010-11-29
源URL	[http://210.72.131.170//handle/173321/5371]
专题	沈阳自动化研究所_工业信息学研究室_工业控制系统研究室
通讯作者	柳长春
作者单位	中国科学院沈阳自动化研究所
推荐引用方式 GB/T 7714	沈志江,于海斌,柳长春. 可重入生产系统的平均报酬型强化学习调度[J]. 信息与控制,2004,33(2):145-150.
APA	沈志江,于海斌,&柳长春.(2004).可重入生产系统的平均报酬型强化学习调度.信息与控制,33(2),145-150.
MLA	沈志江,et al."可重入生产系统的平均报酬型强化学习调度".信息与控制 33.2(2004):145-150.

入库方式： OAI收割

下载0