中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [9]
计算技术研究所 [1]
沈阳自动化研究所 [1]
软件研究所 [1]
采集方式
OAI收割 [12]
内容类型
学位论文 [9]
期刊论文 [3]
发表日期
2024 [3]
2023 [2]
2022 [4]
2021 [1]
2019 [2]
学科主题
计算机科学技术::人... [1]
计算机科学技术::人... [1]
筛选
浏览/检索结果:
共12条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
图式表征引导的智能体协同决策算法研究
学位论文
OAI收割
2024
作者:
阮景晴
  |  
收藏
  |  
浏览/下载:12/0
  |  
提交时间:2024/09/10
多智能体强化学习,多智能体系统,深度强化学习,图式表征,协同决策
表示增强的深度强化学习算法研究
学位论文
OAI收割
2024
作者:
张清扬
  |  
收藏
  |  
浏览/下载:31/0
  |  
提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型
面向多机器人博弈的深度强化学习方法
学位论文
OAI收割
2024
作者:
胡光政
  |  
收藏
  |  
浏览/下载:291/0
  |  
提交时间:2024/07/04
多智能体深度强化学习
多机器人博弈
极小极大Q学习
值分解
最大熵
面向兵棋推演的多智能体智能博弈决策算法研究
学位论文
OAI收割
2023
作者:
余照科
  |  
收藏
  |  
浏览/下载:327/0
  |  
提交时间:2023/01/31
请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词
足球比赛态势智能分析与决策辅助方法研究
学位论文
OAI收割
2023
作者:
陈敏
  |  
收藏
  |  
浏览/下载:133/0
  |  
提交时间:2023/06/27
足球
态势分析
深度学习
多智能体强化学习
迁移学习
对抗场景中的智能体策略泛化研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
陈皓
  |  
收藏
  |  
浏览/下载:79/0
  |  
提交时间:2022/06/16
深度强化学习
多智能体
策略泛化
Ad-Hoc 协作
信用分配
基于深度强化学习的群体协同决策方法研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
吴士广
  |  
收藏
  |  
浏览/下载:449/0
  |  
提交时间:2022/06/15
群体系统
协同决策
深度强化学习
多智能体强化学习
图注意力网络
基于深度强化学习的多智能体协同决策方法研究
学位论文
OAI收割
硕士, 北京: 中国科学院研究生院, 2022
作者:
从聪
  |  
收藏
  |  
浏览/下载:24/0
  |  
提交时间:2022/06/29
深度强化学习
多智能体协作
兵棋推演系统
多智能体通信
面向Ad-Hoc协作的局部观测重建方法
期刊论文
OAI收割
中国科学院大学学报, 2022, 页码: 1
作者:
陈皓
;
杨立昆
;
尹奇跃
;
黄凯奇
  |  
收藏
  |  
浏览/下载:27/0
  |  
提交时间:2022/06/16
多智能体
深度强化学习
信用分配
Ad-Hoc协作
多智能体博弈对抗的协同行为自学习算法与应用
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:
董宗宽
  |  
收藏
  |  
浏览/下载:303/0
  |  
提交时间:2021/06/20
多智能体深度强化学习
协同行为学习
语言几何学
可解释性
Z学习