可重入生产系统的平均报酬型强化学习调度
文献类型:期刊论文
作者 | 沈志江; 于海斌![]() |
刊名 | 信息与控制
![]() |
出版日期 | 2004 |
卷号 | 33期号:2页码:145-150 |
关键词 | 平均报酬型强化学习 可重入系统 调度 暂态差分 |
ISSN号 | 1002-0411 |
其他题名 | Average Reward Reinforcement Learning Scheduling of Closed Reentrant Production Systems |
产权排序 | 1 |
英文摘要 | 在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优于两种熟知的优先权调度策略 . |
语种 | 中文 |
CSCD记录号 | CSCD:1618847 |
资助机构 | 国家自然科学基金资助项目 (699740 3 9) |
公开日期 | 2010-11-29 |
源URL | [http://210.72.131.170//handle/173321/5371] ![]() |
专题 | 沈阳自动化研究所_工业信息学研究室_工业控制系统研究室 |
通讯作者 | 柳长春 |
作者单位 | 中国科学院沈阳自动化研究所 |
推荐引用方式 GB/T 7714 | 沈志江,于海斌,柳长春. 可重入生产系统的平均报酬型强化学习调度[J]. 信息与控制,2004,33(2):145-150. |
APA | 沈志江,于海斌,&柳长春.(2004).可重入生产系统的平均报酬型强化学习调度.信息与控制,33(2),145-150. |
MLA | 沈志江,et al."可重入生产系统的平均报酬型强化学习调度".信息与控制 33.2(2004):145-150. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。