中国科学院机构知识库网格系统: 检索

浏览/检索结果: 共9条，第1-9条

帮助

条数/页：排序方式：
	Data-efficient model-based reinforcement learning with trajectory discrimination 期刊论文 OAI收割 COMPLEX & INTELLIGENT SYSTEMS, 2023, 页码: 10 作者: Qu, Tuo; Duan, Fuqing; Zhang, Junge; Zhao, Bo; Huang, Wenzhen \| 收藏 \| 浏览/下载：18/0 \| 提交时间：2023/11/16 Reinforcement learning Deep learning Continuous control task World model
	Adaptive Critic Designs for Optimal Event-Driven Control of a CSTR System 期刊论文 OAI收割 IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2021, 卷号: 17, 期号: 1, 页码: 484-493 作者: Yang, Xiong; Wei, Qinglai \| 收藏 \| 浏览/下载：56/0 \| 提交时间：2021/01/06 Chemical reactors Optimal control Nonlinear systems Adaptive systems Cost function Informatics Closed loop systems Adaptive critic designs (ACDs) continuous stirred tank reactor (CSTR) discounted cost event-driven control reinforcement learning (RL)
	Learning Continuous Control through Proximal Policy Optimization for Mobile Robot Navigation 会议论文 OAI收割 Hangzhou, China, December 7-8, 2018 作者: Zeng TP(曾太平) \| 收藏 \| 浏览/下载：49/0 \| 提交时间：2018/12/27 Mobile Robots Deep Reinforcement Learning Continuous Control Proximal Policy Optimization Robot Navigation Mobile Robot Learning
	Using reinforcement learning techniques to solve continuous-time non-linear optimal tracking problem without system dynamics 期刊论文 OAI收割 IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1339-1347 作者: Zhu, Yuanheng; Zhao, Dongbin; Li, Xiangjun \| 收藏 \| 浏览/下载：35/0 \| 提交时间：2016/12/26 Nonlinear Control Systems Continuous Time Systems Learning (Artificial Intelligence) Optimal Control Dynamic Programming Lyapunov Methods Linear Systems Reinforcement Learning Continuous-time Problem Nonlinear Optimal Tracking Problem Adaptive Dynamic Programming Model-free Adaptive Optimal Tracking Algorithm Lyapunov Analysis Linear System
	连续状态系统的近似最优在线强化学习学位论文 OAI收割工学博士, 中国科学院自动化研究所: 中国科学院大学, 2015 作者: 朱圆恒收藏 \| 浏览/下载：193/0 \| 提交时间：2015/09/02 强化学习最优控制近似策略迭代概率近似最优连续状态系统收敛性在线学习 kd树 Reinforcement learning optimal control approximate policy iteration probably approximately correct continuous-state system convergence online learning kd-tree
	Dynamic dual adjustment of daily budgets and bids in sponsored search auctions 期刊论文 OAI收割 DECISION SUPPORT SYSTEMS, 2014, 卷号: 57, 页码: 105-114 作者: Zhang, Jie; Yang, Yanwu; Li, Xin; Qin, Rui; Zeng, Daniel 收藏 \| 浏览/下载：24/0 \| 提交时间：2015/08/12 Sponsored search auction Budget adjustment Continuous reinforcement learning Dynamic adjustment
	Neural-network-based online optimal control for uncertain non-linear continuous-time systems with control constraints 期刊论文 OAI收割 IET CONTROL THEORY AND APPLICATIONS, 2013, 卷号: 7, 期号: 17, 页码: 2037-2047 作者: Yang, Xiong; Liu, Derong; Huang, Yuzhu 收藏 \| 浏览/下载：36/0 \| 提交时间：2015/08/12 adaptive control approximation theory closed loop systems continuous time systems Lyapunov methods neurocontrollers nonlinear control systems optimal control robust control uncertain systems neural network-based online adaptive optimal control uncertain nonlinear continuous-time systems control constraints infinite-horizon optimal control problem control policy saturation constraints identifier-critic architecture Hamilton-Jacobi-Bellman equation approximation uncertain system dynamics critic NN action-critic dual networks reinforcement learning identifier NN policy iteration LyapunovaEuros direct method closed loop system stability
	连续状态空间的强化学习问题学位论文 OAI收割工学硕士, 中国科学院自动化研究所: 中国科学院研究生院, 2007 何源收藏 \| 浏览/下载：247/0 \| 提交时间：2015/09/02 强化学习连续状态空间核方法函数逼近 reinforcement learning continuous state space kernel method function
	连续状态-动作空间下强化学习方法的研究学位论文 OAI收割工学博士, 中国科学院自动化研究所: 中国科学院研究生院, 2005 作者: 程玉虎收藏 \| 浏览/下载：263/0 \| 提交时间：2015/09/02 强化学习连续空间函数逼近 RBF 网络模糊推理系统 Reinforcement Learning Continuous Space Function Approximation RBF Network Fuzzy Inference System