中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [2]
沈阳自动化研究所 [1]
采集方式
OAI收割 [3]
内容类型
期刊论文 [3]
发表日期
2024 [1]
2022 [2]
学科主题
筛选
浏览/检索结果:
共3条,第1-3条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
扩展目标跟踪中基于深度强化学习的传感器管理方法
期刊论文
OAI收割
自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1417-1431
作者:
张虹芸
;
陈辉
;
张文旭
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2024/07/25
传感器管理
扩展目标跟踪
深度强化学习
双延迟深度确定性策略梯度
信息增益
基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法
期刊论文
OAI收割
计算机应用, 2022, 页码: 1-8
作者:
邓绍斌
;
朱军
;
周晓锋
;
刘舒锐
  |  
收藏
  |  
浏览/下载:55/0
  |  
提交时间:2022/03/15
工业过程控制
深度强化学习
深度确定性策略梯度
学习效率
青霉素仿真
采用分类经验回放的深度确定性策略梯度方法
期刊论文
OAI收割
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:
时圣苗
;
刘全
  |  
收藏
  |  
浏览/下载:3/0
  |  
提交时间:2024/05/20
连续控制任务
深度确定性策略梯度
经验回放
分类经验回放