中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [7]
计算技术研究所 [2]
沈阳自动化研究所 [2]
软件研究所 [2]
光电技术研究所 [1]
采集方式
OAI收割 [14]
内容类型
期刊论文 [11]
学位论文 [3]
发表日期
2024 [2]
2023 [2]
2022 [3]
2020 [2]
2019 [1]
2009 [2]
更多
学科主题
计算机科学技术::人... [1]
筛选
浏览/检索结果:
共14条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
面向多机器人博弈的深度强化学习方法
学位论文
OAI收割
2024
作者:
胡光政
  |  
收藏
  |  
浏览/下载:292/0
  |  
提交时间:2024/07/04
多智能体深度强化学习
多机器人博弈
极小极大Q学习
值分解
最大熵
基于优先采样模型的离线强化学习
期刊论文
OAI收割
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:
顾扬
;
程玉虎
;
王雪松
  |  
收藏
  |  
浏览/下载:27/0
  |  
提交时间:2024/04/12
离线强化学习
优先采样模型
时序差分误差
鞅
批约束深度Q学习
面向无人艇的T-DQN智能避障算法研究
期刊论文
OAI收割
自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1645-1655
作者:
周治国
  |  
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2024/04/24
无人艇
强化学习
智能避障
深度Q网络
复杂工业过程非串级双速率组合分散运行优化控制
期刊论文
OAI收割
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 172-184
作者:
赵建国
;
杨春雨
  |  
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2024/05/09
复杂工业过程
运行优化控制
奇异摄动理论
Q-学习
双速率
基于强化学习的光学合成孔径活塞误差校正
学位论文
OAI收割
四川成都: 中国科学院光电技术研究所, 2022
作者:
罗云霁
  |  
收藏
  |  
浏览/下载:37/0
  |  
提交时间:2022/06/24
合成孔径,活塞误差,强化学习,q学习
磨矿过程设定值在线优化策略设计
期刊论文
OAI收割
冶金设备管理与维修, 2022, 卷号: 40, 期号: 1, 页码: 5-8
作者:
徐凯
;
罗赛
;
陈洪彬
  |  
收藏
  |  
浏览/下载:40/0
  |  
提交时间:2022/04/23
案例推理
强化学习
Q函数
设定值优化
[4767596]磨矿过程
基于蠕虫传播和FDI的电力信息物理协同攻击策略
期刊论文
OAI收割
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2429-2441
作者:
冯晓萌
;
孙秋野
;
王冰玉
;
高嘉文
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2024/05/20
SIR蠕虫模型
虚假数据注入
信息物理联合仿真
电力系统状态估计
Q学习
基于混合更新Q值的深度强化学习方法研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院大学, 2020
作者:
李主南
  |  
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2020/06/10
深度强化学习
Q 学习算法
过估计
欠估计
Actor-Critic
凸组合
混合更新
基于深度强化学习的单路口交通信号控制
期刊论文
OAI收割
交通工程, 2020, 卷号: 20, 期号: 2, 页码: 54-59
作者:
刘皓
;
吕宜生
  |  
收藏
  |  
浏览/下载:27/0
  |  
提交时间:2021/07/02
深度强化学习
深度Q网络
交通信号控制
智能交通系统
基于增量式RBF网络的Q学习算法
期刊论文
OAI收割
机器人, 2019, 卷号: 41, 期号: 5, 页码: 562-573
作者:
李德才
;
韩建达
  |  
收藏
  |  
浏览/下载:57/0
  |  
提交时间:2019/06/29
核方法
最小二乘算法
增量式学习
移动机器人
Q学习