中国科学院机构知识库网格系统: 基于动态示教数据和行为克隆的深度Q学习网络优化方法

文献类型：专利


作者	李小双1,2 ; 王晓2 ; 王飞跃2 ; 金峻臣 2; 陈薏竹1,2
发表日期	2021-06-29
专利号	ZL202011338992.0
著作权人	李小双 ; 王晓 ; 王飞跃 ; 金峻臣 ; 陈薏竹
国家	中国
文献子类	发明专利
语种	中文
源URL	[http://ir.ia.ac.cn/handle/173211/48852]
专题	自动化研究所_复杂系统管理与控制国家重点实验室_先进控制与自动化团队
作者单位	1.中国科学院大学人工智能学院 2.中国科学院自动化研究所复杂系统管理与控制国家重点实验室
推荐引用方式 GB/T 7714	李小双,王晓,王飞跃,等. 基于动态示教数据和行为克隆的深度Q学习网络优化方法. ZL202011338992.0. 2021-06-29.

入库方式： OAI收割

下载0