中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
机构
采集方式
内容类型
发表日期
学科主题
筛选

浏览/检索结果: 共9条,第1-9条 帮助

条数/页: 排序方式:
Data-efficient model-based reinforcement learning with trajectory discrimination 期刊论文  OAI收割
COMPLEX & INTELLIGENT SYSTEMS, 2023, 页码: 10
作者:  
Qu, Tuo;  Duan, Fuqing;  Zhang, Junge;  Zhao, Bo;  Huang, Wenzhen
  |  收藏  |  浏览/下载:11/0  |  提交时间:2023/11/16
Adaptive Critic Designs for Optimal Event-Driven Control of a CSTR System 期刊论文  OAI收割
IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2021, 卷号: 17, 期号: 1, 页码: 484-493
作者:  
Yang, Xiong;  Wei, Qinglai
  |  收藏  |  浏览/下载:47/0  |  提交时间:2021/01/06
Learning Continuous Control through Proximal Policy Optimization for Mobile Robot Navigation 会议论文  OAI收割
Hangzhou, China, December 7-8, 2018
作者:  
Zeng TP(曾太平)
  |  收藏  |  浏览/下载:39/0  |  提交时间:2018/12/27
Using reinforcement learning techniques to solve continuous-time non-linear optimal tracking problem without system dynamics 期刊论文  OAI收割
IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1339-1347
作者:  
Zhu, Yuanheng;  Zhao, Dongbin;  Li, Xiangjun
  |  收藏  |  浏览/下载:25/0  |  提交时间:2016/12/26
连续状态系统的近似最优在线强化学习 学位论文  OAI收割
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  
朱圆恒
收藏  |  浏览/下载:184/0  |  提交时间:2015/09/02
Dynamic dual adjustment of daily budgets and bids in sponsored search auctions 期刊论文  OAI收割
DECISION SUPPORT SYSTEMS, 2014, 卷号: 57, 页码: 105-114
作者:  
Zhang, Jie;  Yang, Yanwu;  Li, Xin;  Qin, Rui;  Zeng, Daniel
收藏  |  浏览/下载:16/0  |  提交时间:2015/08/12
Neural-network-based online optimal control for uncertain non-linear continuous-time systems with control constraints 期刊论文  OAI收割
IET CONTROL THEORY AND APPLICATIONS, 2013, 卷号: 7, 期号: 17, 页码: 2037-2047
作者:  
Yang, Xiong;  Liu, Derong;  Huang, Yuzhu
收藏  |  浏览/下载:32/0  |  提交时间:2015/08/12
连续状态空间的强化学习问题 学位论文  OAI收割
工学硕士, 中国科学院自动化研究所: 中国科学院研究生院, 2007
何源
收藏  |  浏览/下载:238/0  |  提交时间:2015/09/02
连续状态-动作空间下强化学习方法的研究 学位论文  OAI收割
工学博士, 中国科学院自动化研究所: 中国科学院研究生院, 2005
作者:  
程玉虎
收藏  |  浏览/下载:255/0  |  提交时间:2015/09/02