中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
可重入生产系统的平均报酬型强化学习调度

文献类型:期刊论文

作者沈志江; 于海斌; 柳长春
刊名信息与控制
出版日期2004
卷号33期号:2页码:145-150
关键词平均报酬型强化学习 可重入系统 调度 暂态差分
ISSN号1002-0411
其他题名Average Reward Reinforcement Learning Scheduling of Closed Reentrant Production Systems
产权排序1
英文摘要在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优于两种熟知的优先权调度策略 .
语种中文
CSCD记录号CSCD:1618847
资助机构国家自然科学基金资助项目 (699740 3 9)
公开日期2010-11-29
源URL[http://210.72.131.170//handle/173321/5371]  
专题沈阳自动化研究所_工业信息学研究室_工业控制系统研究室
通讯作者柳长春
作者单位中国科学院沈阳自动化研究所
推荐引用方式
GB/T 7714
沈志江,于海斌,柳长春. 可重入生产系统的平均报酬型强化学习调度[J]. 信息与控制,2004,33(2):145-150.
APA 沈志江,于海斌,&柳长春.(2004).可重入生产系统的平均报酬型强化学习调度.信息与控制,33(2),145-150.
MLA 沈志江,et al."可重入生产系统的平均报酬型强化学习调度".信息与控制 33.2(2004):145-150.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。