基于动态示教数据和行为克隆的深度Q学习网络优化方法
文献类型:专利
作者 | 李小双1,2![]() ![]() ![]() ![]() |
发表日期 | 2021-06-29 |
专利号 | ZL202011338992.0 |
著作权人 | 李小双 ; 王晓 ; 王飞跃 ; 金峻臣 ; 陈薏竹 |
国家 | 中国 |
文献子类 | 发明专利 |
语种 | 中文 |
源URL | [http://ir.ia.ac.cn/handle/173211/48852] ![]() |
专题 | 自动化研究所_复杂系统管理与控制国家重点实验室_先进控制与自动化团队 |
作者单位 | 1.中国科学院大学人工智能学院 2.中国科学院自动化研究所复杂系统管理与控制国家重点实验室 |
推荐引用方式 GB/T 7714 | 李小双,王晓,王飞跃,等. 基于动态示教数据和行为克隆的深度Q学习网络优化方法. ZL202011338992.0. 2021-06-29. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。