中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [8]
心理研究所 [4]
自然科学史研究所 [3]
高能物理研究所 [3]
海洋研究所 [2]
地理科学与资源研究所 [1]
更多
采集方式
OAI收割 [25]
内容类型
期刊论文 [14]
学位论文 [8]
CNKI期刊论文 [1]
会议论文 [1]
项目 [1]
发表日期
2024 [5]
2023 [4]
2021 [1]
2020 [1]
2019 [1]
2017 [1]
更多
学科主题
医学心理学 [1]
变态心理学 [1]
图书馆情报与文献学 [1]
科技研究理论::科学... [1]
管理学 [1]
计算机科学技术 [1]
更多
筛选
浏览/检索结果:
共25条,第1-10条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
双足机器人步态生成的研究
学位论文
OAI收割
2024
作者:
崔凌志
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2024/07/01
请双足机器人控制
混合零动力
轨迹自由强化学习
周期性步态奖励机制
动态步态优化
模型融合策略
基于目标条件强化学习的无监督技能发现方法研究
学位论文
OAI收割
2024
作者:
张天
  |  
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2024/05/30
目标
稀疏奖励
无监督强化学习
探索
技能策略
基于内在动机的深度强化学习探索策略研究
学位论文
OAI收割
2024
作者:
陈忠鹏
  |  
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2024/06/04
深度强化学习,内在动机,探索策略,稀疏奖励
多智能体策略一致性奖励塑造算法研究
学位论文
OAI收割
2024
作者:
杨晨
  |  
收藏
  |  
浏览/下载:31/0
  |  
提交时间:2024/05/27
多智能体系统
深度强化学习
信用分配
奖励塑造
藏北羌塘牧民家庭牲畜存出栏权衡及影响因素分析
期刊论文
OAI收割
草地学报, 2024, 卷号: N/A, 页码: 1-16
作者:
刘增辉
;
周荣柱
;
孙维
;
李少伟
;
张新永
  |  
收藏
  |  
浏览/下载:8/0
  |  
提交时间:2024/08/07
藏北羌塘
牲畜存出栏
草原生态保护补助奖励政策
生计多样性
草地类型
面向稀疏奖励任务的深度强化学习探索方法研究
学位论文
OAI收割
2023
作者:
徐沛
  |  
收藏
  |  
浏览/下载:79/0
  |  
提交时间:2023/06/16
深度强化学习
稀疏奖励
探索
基于深度强化学习的群体协同策略方法研究
学位论文
OAI收割
2023
作者:
张天乐
  |  
收藏
  |  
浏览/下载:159/0
  |  
提交时间:2023/06/12
群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习
融合对手建模的多风格策略集成算法研究
学位论文
OAI收割
2023
作者:
白丰硕
  |  
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2023/06/11
智能博弈对抗
深度强化学习
奖励重塑
多任务强化学习
对手建模
基于终端诱导强化学习的航天器轨道追逃博弈
期刊论文
OAI收割
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 974-984
作者:
耿远卓
;
袁利
;
黄煌
;
汤亮
  |  
收藏
  |  
浏览/下载:11/0
  |  
提交时间:2024/05/09
航天器追逃
智能博弈
近端策略优化
奖励函数设计
终端诱导
未知环境下工业机械臂自主路径规划
学位论文
OAI收割
沈阳: 中国科学院沈阳自动化研究所, 2021
作者:
李振
  |  
收藏
  |  
浏览/下载:40/0
  |  
提交时间:2021/06/12
路径规划
DDPG
估计奖励
信任度
加权动作