中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [4]
采集方式
OAI收割 [4]
_filter
_filter
_filter
筛选
浏览/检索结果:
共4条,第1-4条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
基于视觉表征的深度强化学习方法
学位论文
OAI收割
2024
作者:
刘民颂
  |  
收藏
  |  
浏览/下载:22/0
  |  
提交时间:2024/06/22
深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络
Enhancing Reinforcement Learning via Transformer-based State Predictive Representations
期刊论文
OAI收割
IEEE Transactions on Artificial Intelligence, 2024, 页码: 1 - 12
作者:
Liu MS(刘民颂)
;
Zhu YH(朱圆恒)
;
Chen YR(陈亚冉)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:34/0
  |  
提交时间:2024/06/24
Soft Contrastive Learning with Q-irrelevance Abstraction for Reinforcement Learning
期刊论文
OAI收割
IEEE Transactions on Cognitive and Developmental Systems, 2023, 卷号: 15, 期号: 3, 页码: 1463 - 1473
作者:
Liu MS(刘民颂)
;
Li LT(李伦通)
;
Hao S(郝帅)
;
Zhu YH(朱圆恒)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:17/0
  |  
提交时间:2024/06/24
An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game
会议论文
OAI收割
线上, 2020-5
作者:
Liu MS(刘民颂)
;
Zhu YH(朱圆恒)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:27/0
  |  
提交时间:2024/07/04