中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
计算技术研究所 [2]
自动化研究所 [1]
沈阳自动化研究所 [1]
采集方式
OAI收割 [4]
内容类型
期刊论文 [3]
学位论文 [1]
发表日期
2020 [1]
2019 [1]
2008 [2]
学科主题
计算机科学技术::人... [1]
筛选
浏览/检索结果:
共4条,第1-4条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
作者升序
作者降序
基于混合更新Q值的深度强化学习方法研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院大学, 2020
作者:
李主南
  |  
收藏
  |  
浏览/下载:21/0
  |  
提交时间:2020/06/10
深度强化学习
Q 学习算法
过估计
欠估计
Actor-Critic
凸组合
混合更新
基于增量式RBF网络的Q学习算法
期刊论文
OAI收割
机器人, 2019, 卷号: 41, 期号: 5, 页码: 562-573
作者:
李德才
;
韩建达
;
何玉庆
;
胡艳明
  |  
收藏
  |  
浏览/下载:64/0
  |  
提交时间:2019/06/29
核方法
最小二乘算法
增量式学习
移动机器人
Q学习
基于偏向信息学习的双层强化学习算法
期刊论文
OAI收割
计算机研究与发展, 2008, 期号: 第9期, 页码: 1455~1462页
作者:
史忠植
;
石 川
;
林 芬
;
罗杰文
  |  
收藏
  |  
浏览/下载:12/0
  |  
提交时间:2010/10/12
强化学习
Q-学习算法
偏向信息
偏向信息学习
先验知识
基于偏向信息学习的双层强化学习算法
期刊论文
OAI收割
计算机研究与发展, 2008, 卷号: 45.0, 期号: 009, 页码: 1455
作者:
林芬
;
石川
;
罗杰文
;
史忠植
  |  
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2023/12/04
强化学习
Q-学习算法
偏向信息
偏向信息学习
先验知识