中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [10]
沈阳自动化研究所 [1]
采集方式
OAI收割 [11]
内容类型
学位论文 [11]
发表日期
2023 [5]
2022 [4]
2021 [1]
2020 [1]
学科主题
计算机科学技术::人... [2]
信息科学与系统科学 [1]
计算机科学技术 [1]
计算机科学技术::人... [1]
计算机科学技术::人... [1]
计算机科学技术::人... [1]
更多
筛选
浏览/检索结果:
共11条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
发表日期升序
发表日期降序
题名升序
题名降序
作者升序
作者降序
信息不完备条件下的复杂决策问题高效强化学习算法研究
学位论文
OAI收割
2023
作者:
赵恩民
  |  
收藏
  |  
浏览/下载:12/0
  |  
提交时间:2023/06/08
信息不完备
复杂决策问题
强化学习
单智能体探索
不完美信息博弈
面向稀疏奖励环境的多智能体协同探索问题研究
学位论文
OAI收割
2023
作者:
白云鹏
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心
面向稀疏奖励任务的深度强化学习探索方法研究
学位论文
OAI收割
2023
作者:
徐沛
  |  
收藏
  |  
浏览/下载:19/0
  |  
提交时间:2023/06/16
深度强化学习
稀疏奖励
探索
融合层级目标关系图的开放环境语义目标导航研究
学位论文
OAI收割
2023
作者:
许涛
  |  
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2023/06/25
语义目标导航
层级目标关系图
具身智能
经验重放
足球比赛态势智能分析与决策辅助方法研究
学位论文
OAI收割
2023
作者:
陈敏
  |  
收藏
  |  
浏览/下载:53/0
  |  
提交时间:2023/06/27
足球
态势分析
深度学习
多智能体强化学习
迁移学习
基于关系网络的多智能体协同分层决策技术
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
张朋朋
  |  
收藏
  |  
浏览/下载:42/0
  |  
提交时间:2022/06/13
多智能体协同
关系网络
分层
热力图
可解释性
知识数据混合驱动的策略学习及在兵棋决策中的运用
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
刘轩
  |  
收藏
  |  
浏览/下载:81/0
  |  
提交时间:2022/06/17
复杂对抗环境
认知智能
知识数据混合驱动
状态回溯
分层决策
陆战兵棋
基于深度强化学习的扁平类物体预抓取操作的研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
吴家汐
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2022/06/13
预抓取操作
深度强化学习
课程学习
基于元学习和强化学习的机器人操作视觉模仿技术研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
李佳怡
  |  
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2022/06/13
机器人操作学习
视觉模仿
元学习
强化学习
未知环境下工业机械臂自主路径规划
学位论文
OAI收割
沈阳: 中国科学院沈阳自动化研究所, 2021
作者:
李振
  |  
收藏
  |  
浏览/下载:18/0
  |  
提交时间:2021/06/12
路径规划
DDPG
估计奖励
信任度
加权动作