中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [13]
沈阳自动化研究所 [3]
计算技术研究所 [1]
采集方式
OAI收割 [17]
内容类型
学位论文 [9]
期刊论文 [8]
发表日期
2024 [2]
2023 [5]
2022 [2]
2021 [4]
2019 [2]
2017 [1]
更多
学科主题
信息科学与系统科学 [1]
计算机科学技术::人... [1]
筛选
浏览/检索结果:
共17条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
面向多机器人博弈的深度强化学习方法
学位论文
OAI收割
2024
作者:
胡光政
  |  
收藏
  |  
浏览/下载:292/0
  |  
提交时间:2024/07/04
多智能体深度强化学习
多机器人博弈
极小极大Q学习
值分解
最大熵
基于距离信息的追逃策略:信念状态连续随机博弈
期刊论文
OAI收割
自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 828-840
作者:
陈灵敏
;
冯宇
;
李永强
  |  
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/04/28
追逃问题
信念区域状态
连续随机博弈
马尔科夫决策过程
强化学习
信息不完备条件下的复杂决策问题高效强化学习算法研究
学位论文
OAI收割
2023
作者:
赵恩民
  |  
收藏
  |  
浏览/下载:21/0
  |  
提交时间:2023/06/08
信息不完备
复杂决策问题
强化学习
单智能体探索
不完美信息博弈
基于表示学习和对手建模的动态博弈系统策略生成技术研究
学位论文
OAI收割
2023
作者:
詹员
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2023/06/06
深度强化学习
表示学习
对手建模
空中博弈
融合对手建模的多风格策略集成算法研究
学位论文
OAI收割
2023
作者:
白丰硕
  |  
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2023/06/11
智能博弈对抗
深度强化学习
奖励重塑
多任务强化学习
对手建模
多智能体博弈、学习与控制
期刊论文
OAI收割
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:
王龙
;
黄锋
  |  
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2024/05/09
博弈论
多智能体学习
控制论
强化学习
人工智能
兵棋推演的智能决策技术与挑战
期刊论文
OAI收割
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
作者:
尹奇跃
;
赵美静
;
倪晚成
;
张俊格
;
黄凯奇
  |  
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2024/05/09
兵棋推演
人机对抗
智能决策技术
博弈学习
两人零和博弈中的对抗学习与适应算法研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
吴哲
  |  
收藏
  |  
浏览/下载:45/0
  |  
提交时间:2022/06/17
机器博弈
两人零和博弈
纳什均衡
对手建模
元学习
基于Stackelberg博弈的边缘云资源定价机制研究
期刊论文
OAI收割
计算机科学与探索, 2022, 卷号: 16, 期号: 1, 页码: 153-162
作者:
刘荆欣
;
王妍
;
韩笑
;
夏长清
;
宋宝燕
  |  
收藏
  |  
浏览/下载:91/0
  |  
提交时间:2020/10/24
移动边缘计算
资源定价机制
Stackelberg博弈
强化学习
基于演化学习与对手策略的不完美信息博弈算法研究
学位论文
OAI收割
中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:
张蒙
  |  
收藏
  |  
浏览/下载:107/0
  |  
提交时间:2021/06/20
不完美信息博弈
德州扑克
演化学习
在线对手建模
种群策略集成