中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
机构
采集方式
内容类型
发表日期
学科主题
筛选

浏览/检索结果: 共16条,第1-10条 帮助

条数/页: 排序方式:
Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文  OAI收割
日本, 2024-6
作者:  
Zhang Qingyang;  Xu Bo
  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/06/25
表示增强的深度强化学习算法研究 学位论文  OAI收割
2024
作者:  
张清扬
  |  收藏  |  浏览/下载:32/0  |  提交时间:2024/06/04
基于基础模型的分层强化学习 学位论文  OAI收割
2024
作者:  
吴俣桥
  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/06/21
基于强化学习的多智能体协同决策关键问题研究 学位论文  OAI收割
2024
作者:  
徐志伟
  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28
分层强化学习的子目标生成与探索策略 学位论文  OAI收割
2024
作者:  
王开申
  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/27
基于强化学习动作空间精简的时序决策任务算法研究 学位论文  OAI收割
2024
作者:  
王梓薏
  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/07/04
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文  OAI收割
中国重庆, 2024.5.7-5.9
作者:  
Niu LY(钮龙宇);  Wan J(万军)
  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/28
面向高仿真场景的深度强化学习算法研究 学位论文  OAI收割
2024
作者:  
钮龙宇
  |  收藏  |  浏览/下载:33/0  |  提交时间:2024/05/28
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文  OAI收割
澳大利亚, 2023-6
作者:  
Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng
  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/06/25
肌肉骨骼机器人神经启发式分层运动学习研究 学位论文  OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  
周俊杰
  |  收藏  |  浏览/下载:92/0  |  提交时间:2022/06/14