中国科学院机构知识库网格系统: 检索

浏览/检索结果: 共3条，第1-3条

帮助

条数/页：排序方式：
	采用分类经验回放的深度确定性策略梯度方法期刊论文 OAI收割自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823 作者: 时圣苗; 刘全 \| 收藏 \| 浏览/下载：8/0 \| 提交时间：2024/05/20 连续控制任务深度确定性策略梯度经验回放分类经验回放
	连续状态系统的近似最优在线强化学习学位论文 OAI收割工学博士, 中国科学院自动化研究所: 中国科学院大学, 2015 作者: 朱圆恒收藏 \| 浏览/下载：188/0 \| 提交时间：2015/09/02 强化学习最优控制近似策略迭代概率近似最优连续状态系统收敛性在线学习 kd树 Reinforcement learning optimal control approximate policy iteration probably approximately correct continuous-state system convergence online learning kd-tree
	汉语连续语音识别原理与机制研究学位论文 OAI收割博士, 中国科学院声学研究所: 中国科学院声学研究所, 1997 皮晓波收藏 \| 浏览/下载：12/0 \| 提交时间：2011/05/07 语音识别隐马尔可夫模型训练策略连续策略