中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [10]
计算技术研究所 [2]
采集方式
OAI收割 [12]
内容类型
学位论文 [6]
会议论文 [3]
期刊论文 [3]
发表日期
2024 [8]
2023 [1]
2022 [1]
2008 [2]
学科主题
计算机科学技术::人... [2]
计算机科学技术::人... [1]
计算机科学技术::人... [1]
筛选
浏览/检索结果:
共12条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination
会议论文
OAI收割
日本, 2024-6
作者:
Zhang Qingyang
;
Xu Bo
  |  
收藏
  |  
浏览/下载:11/0
  |  
提交时间:2024/06/25
强化学习,分层强化学习
表示增强的深度强化学习算法研究
学位论文
OAI收割
2024
作者:
张清扬
  |  
收藏
  |  
浏览/下载:32/0
  |  
提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型
基于基础模型的分层强化学习
学位论文
OAI收割
2024
作者:
吴俣桥
  |  
收藏
  |  
浏览/下载:17/0
  |  
提交时间:2024/06/21
强化学习
分层强化学习
基础模型
基于强化学习的多智能体协同决策关键问题研究
学位论文
OAI收割
2024
作者:
徐志伟
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2024/05/28
强化学习
多智能体系统
协同与合作
分层决策
对比学习
分层强化学习的子目标生成与探索策略
学位论文
OAI收割
2024
作者:
王开申
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2024/05/27
分层强化学习,子目标生成,互信息,扩散模型
基于强化学习动作空间精简的时序决策任务算法研究
学位论文
OAI收割
2024
作者:
王梓薏
  |  
收藏
  |  
浏览/下载:12/0
  |  
提交时间:2024/07/04
时序决策
强化学习
动作空间约简
分层强化学习
动作掩码
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning
会议论文
OAI收割
中国重庆, 2024.5.7-5.9
作者:
Niu LY(钮龙宇)
;
Wan J(万军)
  |  
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2024/05/28
深度强化学习
表征学习
分层学习
面向高仿真场景的深度强化学习算法研究
学位论文
OAI收割
2024
作者:
钮龙宇
  |  
收藏
  |  
浏览/下载:33/0
  |  
提交时间:2024/05/28
深度强化学习
高仿真场景
分层学习
模仿学习
表征学习
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs
会议论文
OAI收割
澳大利亚, 2023-6
作者:
Zhang Qingyang
;
Yang Yiming
;
Ruan Jingqing
;
Xiong Xuantang
;
Xing Dengpeng
  |  
收藏
  |  
浏览/下载:18/0
  |  
提交时间:2024/06/25
强化学习,分层强化学习
基于GPR和深度强化学习的分层人机协作控制
期刊论文
OAI收割
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2352-2360
作者:
金哲豪
;
刘安东
;
俞立
  |  
收藏
  |  
浏览/下载:13/0
  |  
提交时间:2024/05/20
深度强化学习
高斯过程回归
人体控制策略感知
分层人机协作