中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [35]
采集方式
OAI收割 [35]
内容类型
期刊论文 [21]
会议论文 [14]
发表日期
2024 [5]
2023 [8]
2022 [5]
2021 [1]
2020 [3]
2019 [2]
更多
学科主题
筛选
浏览/检索结果:
共35条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making
期刊论文
OAI收割
Machine Intelligence Research, 2024, 页码: 19
作者:
Ruan JQ(阮景晴)
;
Kaishen Wang
;
Qingyang Zhang
;
Dengpeng Xing
;
Bo Xu
  |  
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2024/09/10
Learning Causal Dynamics Models in Object-Oriented Environments
会议论文
OAI收割
奥地利, 维也纳, 2024-07-21
作者:
Yu ZY(余忠蔚)
;
Ruan JQ(阮景晴)
;
Xing DP(邢登鹏)
  |  
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2024/05/28
强化学习
因果模型
Learning Playing Piano with Bionic-Constrained Diffusion Policy for Anthropomorphic Hand
期刊论文
OAI收割
Cyborg and Bionic Systems, 2024, 卷号: 5, 页码: 0104
作者:
Yang YM(杨依明)
;
Wang ZC(王泽昌)
;
Xing DP(邢登鹏)
;
Wang P(王鹏)
  |  
收藏
  |  
浏览/下载:18/0
  |  
提交时间:2024/05/30
A New Pre-Training Paradigm for Offline Multi-Agent Reinforcement Learning with Suboptimal Data
会议论文
OAI收割
Seoul, Korea, 2024.4.14-2024.4.19
作者:
Meng Linghui
;
Zhang Xi
;
Xing Dengpeng
;
Xu Bo
  |  
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2024/06/11
Enhancing Multi-agent Coordination via Dual-channel Consensus
期刊论文
OAI收割
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 349-368
作者:
Qingyang Zhang
;
Kaishen Wang
;
Jingqing Ruan
;
Yiming Yang
;
Dengpeng Xing
  |  
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2024/04/23
Multi-agent reinforcement learning, contrastive representation learning, consensus, multi-agent cooperation, cognitive consistency
Efficient Hierarchical Reinforcement Learning via Mutual Information Constrained Subgoal Discovery
会议论文
OAI收割
长沙, 2023-11
作者:
Kaishen Wang
;
Jingqing Ruan
;
Qingyang Zhang
;
Dengpeng Xing
  |  
收藏
  |  
浏览/下载:92/0
  |  
提交时间:2024/05/28
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning
期刊论文
OAI收割
Machine Intelligence Research, 2023, 页码: 158
作者:
Zhang Qingyang
;
Zhang Hongming
;
Xing Dengpeng
;
Bo Xu
  |  
收藏
  |  
浏览/下载:26/0
  |  
提交时间:2024/06/25
Filtered Observations for Model-Based Multi-agent Reinforcement Learning
会议论文
OAI收割
Turin, Italy, 2023.9.18-2023.9.22
作者:
Meng Linghui
;
Xiong Xuantang
;
Zang Yifan
;
Zhang Xi
;
Li Guoqi
  |  
收藏
  |  
浏览/下载:3/0
  |  
提交时间:2024/06/11
Explainable Reinforcement Learning via a Causal World Model
会议论文
OAI收割
中国澳门, 2023-08-22
作者:
Yu ZY(余忠蔚)
;
Ruan JQ(阮景晴)
;
Xing DP(邢登鹏)
  |  
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/05/28
强化学习
可解释人工智能
因果推理
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs
会议论文
OAI收割
澳大利亚, 2023-6
作者:
Zhang Qingyang
;
Yang Yiming
;
Ruan Jingqing
;
Xiong Xuantang
;
Xing Dengpeng
  |  
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2024/06/25
强化学习,分层强化学习