中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
不确定工业过程运行指标异步更新强化学习决策算法

文献类型:期刊论文

作者李金娜; 袁林; 丁进良
刊名自动化学报
出版日期2023
卷号49期号:2页码:461-472
关键词运行优化控制 强化学习 数据驱动控制 自适应动态规划 安全运行
ISSN号0254-4156
DOI10.16383/j.aas.c210983
英文摘要运行指标决策问题是实现工业过程运行安全和生产指标优化的关键.考虑到多运行指标决策问题求解的复杂性和工业过程生产条件动态波动引发生产指标状态的不确定性,提出了一种策略异步更新强化学习算法自学习决策运行指标,并给出算法收敛性的理论证明.该算法在随机自适应动态规划框架下,利用样本均值代替计算生产指标状态转移概率矩阵,因此无需要求生产指标状态转移概率矩阵已知.并且通过引入时钟和定义其阈值,采用集中式策略评估、多策略异步更新方式用以简化求解多运行指标决策问题,提高强化学习的学习效率.利用可测量数据,自学习得到的运行指标能够保证生产指标优化,并且限制在规定范围之内.最后,采用中国西部某大型选矿厂的实际数据进行仿真验证,表明该方法的有效性.
源URL[http://ir.ia.ac.cn/handle/173211/56204]  
专题自动化研究所_学术期刊_自动化学报
推荐引用方式
GB/T 7714
李金娜,袁林,丁进良. 不确定工业过程运行指标异步更新强化学习决策算法[J]. 自动化学报,2023,49(2):461-472.
APA 李金娜,袁林,&丁进良.(2023).不确定工业过程运行指标异步更新强化学习决策算法.自动化学报,49(2),461-472.
MLA 李金娜,et al."不确定工业过程运行指标异步更新强化学习决策算法".自动化学报 49.2(2023):461-472.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。