中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [4]
采集方式
OAI收割 [4]
内容类型
期刊论文 [3]
会议论文 [1]
发表日期
2023 [2]
2022 [2]
学科主题
筛选
浏览/检索结果:
共4条,第1-4条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
CASOG: Conservative Actor–Critic With SmOoth Gradient for Skill Learning in Robot-Assisted Intervention
期刊论文
OAI收割
IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS, 2023, 页码: 10
作者:
Li, Hao
;
Zhou, Xiao-Hu
;
Xie, Xiao-Liang
;
Liu, Shi-Qi
;
Feng, Zhen-Qiu
  |  
收藏
  |  
浏览/下载:25/0
  |  
提交时间:2024/02/22
Deep neural network
offline reinforcement learning
robot-assisted intervention
vascular robotic system
Offline Pre-trained Multi-agent Decision Transformer
期刊论文
OAI收割
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 233-248
作者:
Linghui Meng
;
Muning Wen
;
Chenyang Le
;
Xiyun Li
;
Dengpeng Xing
  |  
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2024/04/23
Pre-training model
multi-agent reinforcement learning (MARL)
decision making
transformer
offline reinforcement learning
Offline reinforcement learning with representations for actions
期刊论文
OAI收割
INFORMATION SCIENCES, 2022, 卷号: 610, 页码: 746-758
作者:
Lou, Xingzhou
;
Yin, Qiyue
;
Zhang, Junge
;
Yu, Chao
;
He, Zhaofeng
  |  
收藏
  |  
浏览/下载:45/0
  |  
提交时间:2022/11/14
Offline reinforcement learning
Action embedding
POPO: Pessimistic Offline Policy Optimization
会议论文
OAI收割
Singapore, Singapore, 23-27 May 2022
作者:
He Q(何强)
;
Hou XW(侯新文)
;
Liu Y(刘禹)
  |  
收藏
  |  
浏览/下载:24/0
  |  
提交时间:2022/06/27
reinforcement learning
offline optimization
out-of-distribution