中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
上海应用物理研究... [194]
自动化研究所 [36]
化学研究所 [28]
计算技术研究所 [24]
高能物理研究所 [16]
物理研究所 [13]
更多
采集方式
OAI收割 [333]
iSwitch采集 [17]
内容类型
期刊论文 [324]
会议论文 [22]
专利 [3]
专著章节/文集论文 [1]
发表日期
2023 [3]
2021 [5]
2020 [36]
2019 [113]
2018 [52]
2017 [3]
更多
学科主题
Environmen... [3]
Chemistry [2]
Engineerin... [2]
半导体材料 [2]
材料科学与物理化学 [2]
Biochemist... [1]
更多
筛选
浏览/检索结果:
共350条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Enhancing Reinforcement Learning via Transformer-based State Predictive Representations
期刊论文
OAI收割
IEEE Transactions on Artificial Intelligence, 2024, 页码: 1 - 12
作者:
Liu MS(刘民颂)
;
Zhu YH(朱圆恒)
;
Chen YR(陈亚冉)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:30/0
  |  
提交时间:2024/06/24
Soft Contrastive Learning with Q-irrelevance Abstraction for Reinforcement Learning
期刊论文
OAI收割
IEEE Transactions on Cognitive and Developmental Systems, 2023, 卷号: 15, 期号: 3, 页码: 1463 - 1473
作者:
Liu MS(刘民颂)
;
Li LT(李伦通)
;
Hao S(郝帅)
;
Zhu YH(朱圆恒)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2024/06/24
Advantage Constrained Proximal Policy Optimization in Multi-Agent Reinforcement Learning
会议论文
OAI收割
昆士兰, 2023-6
作者:
Li WF(李伟凡)
;
Zhu YH(朱圆恒)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2023/06/29
multi-agent
reinforcement learning
policy gradient
NeuronsMAE: A Novel Multi-Agent Reinforcement Learning Environment for Cooperative and Competitive Multi-Robot Tasks
会议论文
OAI收割
Queensland, Australia, 2023-6
作者:
Hu GZ(胡光政)
;
Li HR(李浩然)
;
Liu SS(刘莎莎)
;
Zhu YH(朱圆恒)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:24/0
  |  
提交时间:2024/07/04
Dynamic-horizon model-based value estimation with latent imagination
期刊论文
OAI收割
IEEE Transactions on Neural Networks and Learning Systems, 2022, 页码: 1-14
作者:
Wang JJ(王俊杰)
;
Zhang QC(张启超)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2023/05/30
Latent world model
model-based value expansion (MVE)
reinforcement learning
reinforcement learning
Organic-inorganic hybrid metallic conductors based on bis(ethylenedithio)tetrathiafulvalene cations and antiferromagnetic oxalate-bridged copper(ii) dinuclear anions
期刊论文
OAI收割
JOURNAL OF MATERIALS CHEMISTRY C, 2022, 卷号: 10, 期号: 7, 页码: 2845-2852
作者:
Zhang, B
;
Zhang, Y
;
Wang, ZM
;
Wang, DW
;
Yang, DL
  |  
收藏
  |  
浏览/下载:20/0
  |  
提交时间:2023/11/10
Distantly Supervised Relation Extraction in Federated Settings
会议论文
OAI收割
Punta Cana, Dominican Republic, 2021
作者:
Sui DB(隋典伯)
;
Yubo Chen
;
Kang Liu
;
Jun Zhao
  |  
收藏
  |  
浏览/下载:33/0
  |  
提交时间:2022/06/28
Set Generation Networks for End-to-End Knowledge Base Population
会议论文
OAI收割
Online and Punta Cana, Dominican Republic, 2021-11
作者:
Sui DB(隋典伯)
;
Chenhao Wang
;
Yubo Chen
;
Kang Liu
;
Jun Zhao
  |  
收藏
  |  
浏览/下载:35/0
  |  
提交时间:2022/06/28
Benchmarking lane-changing decision-making for deep reinforcement learning
会议论文
OAI收割
Guangzhou, China, 2021-11
作者:
Wang JJ(王俊杰)
;
Zhang QC(张启超)
;
Zhao DB(赵冬斌)
  |  
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2023/05/30
A Large-Scale Chinese Multimodal NER Dataset with Speech Clues
会议论文
OAI收割
Online, 2021-8
作者:
Sui DB(隋典伯)
;
Zhengkun Tian
;
Yubo Chen
;
Kang Liu
;
Jun Zhao
  |  
收藏
  |  
浏览/下载:29/0
  |  
提交时间:2022/06/28