中国科学院机构知识库网格系统: 检索

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

首页机构成果学者

登录注册

登陆

验证码:

换一张

忘记密码？记住我

取消登录

校外用户登录

取消

CAS IR Grid

机构

自动化研究所 [10]
计算技术研究所 [2]

采集方式

OAI收割 [12]

内容类型

学位论文 [6]
会议论文 [3]
期刊论文 [3]

发表日期

2024 [8]
2023 [1]
2022 [1]
2008 [2]

学科主题

计算机科学技术::人... [2]
计算机科学技术::人... [1]
计算机科学技术::人... [1]

筛选

浏览/检索结果: 共12条，第1-10条

帮助

条数/页：排序方式：
	Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 OAI收割日本, 2024-6 作者: Zhang Qingyang \| 收藏 \|
	表示增强的深度强化学习算法研究学位论文 OAI收割 2024 作者: 张清扬 \| 收藏 \|
	基于基础模型的分层强化学习学位论文 OAI收割 2024 作者: 吴俣桥 \| 收藏 \|
	基于强化学习的多智能体协同决策关键问题研究学位论文 OAI收割 2024 作者: 徐志伟 \| 收藏 \|
	分层强化学习的子目标生成与探索策略学位论文 OAI收割 2024 作者: 王开申 \| 收藏 \|
	基于强化学习动作空间精简的时序决策任务算法研究学位论文 OAI收割 2024 作者: 王梓薏 \| 收藏 \|
	D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文 OAI收割中国重庆, 2024.5.7-5.9 作者: Niu LY(钮龙宇); Wan J(万军) \| 收藏 \|
	面向高仿真场景的深度强化学习算法研究学位论文 OAI收割 2024 作者: 钮龙宇 \| 收藏 \|
	Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 OAI收割澳大利亚, 2023-6 作者: Zhang Qingyang; Yang Yiming; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng \| 收藏 \|
	基于GPR和深度强化学习的分层人机协作控制期刊论文 OAI收割自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2352-2360 作者: 金哲豪; 刘安东 \| 收藏 \|

» 欧盟学术资源开放存取平台
» CALIS高校机构知识库
» 台湾学术机构典藏
» 香港机构知识库整合系统
网站地图
意见反馈

版权所有 @2026 中国科学院 - 运行维护：中国科学院兰州文献情报中心/中国科学院西北生态环境资源研究院 - Powered by CSpace

0931-8270076 发送邮件

陇ICP备2021001824号-8

甘公网安备 62010202001088号