中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [20]
软件研究所 [5]
计算技术研究所 [1]
国家空间科学中心 [1]
沈阳自动化研究所 [1]
采集方式
OAI收割 [28]
内容类型
学位论文 [21]
期刊论文 [6]
会议论文 [1]
发表日期
2024 [6]
2023 [6]
2022 [7]
2021 [3]
2020 [1]
2019 [3]
更多
学科主题
计算机科学技术::人... [2]
计算机科学技术::人... [2]
控制理论与控制工程 [1]
计算机科学技术 [1]
筛选
浏览/检索结果:
共28条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
图式表征引导的智能体协同决策算法研究
学位论文
OAI收割
2024
作者:
阮景晴
  |  
收藏
  |  
浏览/下载:12/0
  |  
提交时间:2024/09/10
多智能体强化学习,多智能体系统,深度强化学习,图式表征,协同决策
面向多任务和属性泛化的多智能体强化学习算法研究
学位论文
OAI收割
2024
作者:
黄上京
  |  
收藏
  |  
浏览/下载:22/0
  |  
提交时间:2024/06/01
多智能体强化学习
多任务强化学习
多智能体属性组成泛化
实体多机器人平台
表示增强的深度强化学习算法研究
学位论文
OAI收割
2024
作者:
张清扬
  |  
收藏
  |  
浏览/下载:31/0
  |  
提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型
多智能体强化学习预训练方法研究
学位论文
OAI收割
2024
作者:
孟令辉
  |  
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2024/05/28
多智能体强化学习
预训练方法
神经网络
表示学习
在线强化评估
面向多机器人博弈的深度强化学习方法
学位论文
OAI收割
2024
作者:
胡光政
  |  
收藏
  |  
浏览/下载:292/0
  |  
提交时间:2024/07/04
多智能体深度强化学习
多机器人博弈
极小极大Q学习
值分解
最大熵
基于序列展开模型的多智能体方法研究
学位论文
OAI收割
2024
作者:
Luo ZX(罗正昕)
  |  
收藏
  |  
浏览/下载:20/0
  |  
提交时间:2024/05/30
多智能体
强化学习
序列展开模型
信度分配
非平稳性
面向兵棋推演的多智能体智能博弈决策算法研究
学位论文
OAI收割
2023
作者:
余照科
  |  
收藏
  |  
浏览/下载:327/0
  |  
提交时间:2023/01/31
请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词
融合信息素机制的大规模多智能体协同技术
学位论文
OAI收割
2023
作者:
JiaHui Zhang
  |  
收藏
  |  
浏览/下载:18/0
  |  
提交时间:2023/06/26
大规模多智能体协同
多智能体强化学习
信息素机制
知识蒸馏
面向稀疏奖励环境的多智能体协同探索问题研究
学位论文
OAI收割
2023
作者:
白云鹏
  |  
收藏
  |  
浏览/下载:19/0
  |  
提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心
足球比赛态势智能分析与决策辅助方法研究
学位论文
OAI收割
2023
作者:
陈敏
  |  
收藏
  |  
浏览/下载:133/0
  |  
提交时间:2023/06/27
足球
态势分析
深度学习
多智能体强化学习
迁移学习