中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [2]
采集方式
OAI收割 [2]
内容类型
会议论文 [1]
学位论文 [1]
发表日期
2023 [2]
学科主题
计算机科学技术 [1]
计算机科学技术::人... [1]
计算机科学技术::人... [1]
筛选
浏览/检索结果:
共2条,第1-2条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction
会议论文
OAI收割
美国 华盛顿, 2023.02.07 - 2023.02.14
作者:
Bai FS(白丰硕)
;
Zhang HM(张鸿铭)
;
Tao TY(陶天阳)
;
Wu ZH(武志亨)
;
Wang YN(王燕娜)
  |  
收藏
  |  
浏览/下载:25/0
  |  
提交时间:2023/07/05
Reinforcement Learning Algorithms
Transfer
Domain Adaptation
Multi-Task Learning
融合对手建模的多风格策略集成算法研究
学位论文
OAI收割
2023
作者:
白丰硕
  |  
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2023/06/11
智能博弈对抗
深度强化学习
奖励重塑
多任务强化学习
对手建模