可重入生产系统的平均报酬型强化学习调度
文献类型:期刊论文
| 作者 | 沈志江; 于海斌 ; 柳长春
|
| 刊名 | 信息与控制
![]() |
| 出版日期 | 2004 |
| 卷号 | 33期号:2页码:145-150 |
| 关键词 | 平均报酬型强化学习 可重入系统 调度 暂态差分 |
| ISSN号 | 1002-0411 |
| 其他题名 | Average Reward Reinforcement Learning Scheduling of Closed Reentrant Production Systems |
| 产权排序 | 1 |
| 英文摘要 | 在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优于两种熟知的优先权调度策略 . |
| 语种 | 中文 |
| CSCD记录号 | CSCD:1618847 |
| 资助机构 | 国家自然科学基金资助项目 (699740 3 9) |
| 公开日期 | 2010-11-29 |
| 源URL | [http://210.72.131.170//handle/173321/5371] ![]() |
| 专题 | 沈阳自动化研究所_工业信息学研究室_工业控制系统研究室 |
| 通讯作者 | 柳长春 |
| 作者单位 | 中国科学院沈阳自动化研究所 |
| 推荐引用方式 GB/T 7714 | 沈志江,于海斌,柳长春. 可重入生产系统的平均报酬型强化学习调度[J]. 信息与控制,2004,33(2):145-150. |
| APA | 沈志江,于海斌,&柳长春.(2004).可重入生产系统的平均报酬型强化学习调度.信息与控制,33(2),145-150. |
| MLA | 沈志江,et al."可重入生产系统的平均报酬型强化学习调度".信息与控制 33.2(2004):145-150. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


