中国科学院机构知识库网格系统: 检索

浏览/检索结果: 共4条，第1-4条

帮助

条数/页：排序方式：
	分层强化学习的子目标生成与探索策略学位论文 OAI收割 2024 作者: 王开申 \| 收藏 \|
	Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 OAI收割 Machine Intelligence Research, 2024, 页码: 19 作者: Ruan JQ(阮景晴); Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu \| 收藏 \|
	Enhancing Multi-agent Coordination via Dual-channel Consensus 期刊论文 OAI收割 Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 349-368 作者: Qingyang Zhang; Kaishen Wang; Jingqing Ruan; Yiming Yang; Dengpeng Xing \| 收藏 \|
	Efficient Hierarchical Reinforcement Learning via Mutual Information Constrained Subgoal Discovery 会议论文 OAI收割长沙, 2023-11 作者: Kaishen Wang; Jingqing Ruan; Qingyang Zhang; Dengpeng Xing \| 收藏 \|