中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [4]
采集方式
OAI收割 [4]
内容类型
学位论文 [3]
期刊论文 [1]
发表日期
2024 [1]
2022 [3]
学科主题
计算机科学技术::人... [1]
筛选
浏览/检索结果:
共4条,第1-4条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
作者升序
作者降序
多智能体策略一致性奖励塑造算法研究
学位论文
OAI收割
2024
作者:
杨晨
  |  
收藏
  |  
浏览/下载:34/0
  |  
提交时间:2024/05/27
多智能体系统
深度强化学习
信用分配
奖励塑造
对抗场景中的智能体策略泛化研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
陈皓
  |  
收藏
  |  
浏览/下载:96/0
  |  
提交时间:2022/06/16
深度强化学习
多智能体
策略泛化
Ad-Hoc 协作
信用分配
对抗环境中基于值分解框架的多智能体协同算法研究
学位论文
OAI收割
中科院自动化研究所: 中科院自动化研究所, 2022
作者:
杨光开
  |  
收藏
  |  
浏览/下载:44/0
  |  
提交时间:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络
面向Ad-Hoc协作的局部观测重建方法
期刊论文
OAI收割
中国科学院大学学报, 2022, 页码: 1
作者:
陈皓
;
杨立昆
;
尹奇跃
;
黄凯奇
  |  
收藏
  |  
浏览/下载:31/0
  |  
提交时间:2022/06/16
多智能体
深度强化学习
信用分配
Ad-Hoc协作