中国科学院机构知识库网格系统: 水下滑翔蛇形机器人滑翔控制的强化学习方法

水下滑翔蛇形机器人滑翔控制的强化学习方法

文献类型：期刊论文


作者	常健2,3 ; 唐敬阁1,2,3 ; 张晓路 2,3,4; 李斌2,3
刊名	机器人
出版日期	2019
卷号	41 期号:3 页码:334-342
关键词	强化学习水下滑翔蛇形机器人马尔可夫决策过程循环神经网络
ISSN号	1002-0446
其他题名	A Reinforcement Learning Method for Gliding Control of Underwater Gliding Snake-like Robot
产权排序	1
英文摘要	研究了一种强化学习算法,用于水下滑翔蛇形机器人的滑翔运动控制.针对水动力环境难以建模的问题,使用强化学习方法使水下滑翔蛇形机器人自适应复杂的水环境,并自动学习仅通过调节浮力来控制滑翔运动.对此,提出了循环神经网络蒙特卡洛策略梯度算法,改善了由于机器人的状态难以完全观测而导致的算法难以训练的问题,并将水下滑翔蛇形机器人的基本滑翔动作控制问题近似为马尔可夫决策过程,从而得到有效的滑翔控制策略.通过仿真和实验证明了所提出方法的有效性.
语种	中文
CSCD记录号	CSCD:6505296
资助机构	国家重点研发计划（2017YFB1300101） ; 国家自然科学基金青年基金（61803365）
源URL	[http://ir.sia.cn/handle/173321/24403]
专题	沈阳自动化研究所_机器人学研究室
通讯作者	常健
作者单位	1.中国科学院大学 2.中国科学院机器人与智能制造创新研究院 3.中国科学院沈阳自动化研究所机器人学国家重点实验室 4.东北大学信息科学与工程学院
推荐引用方式 GB/T 7714	常健,唐敬阁,张晓路,等. 水下滑翔蛇形机器人滑翔控制的强化学习方法[J]. 机器人,2019,41(3):334-342.
APA	常健,唐敬阁,张晓路,&李斌.(2019).水下滑翔蛇形机器人滑翔控制的强化学习方法.机器人,41(3),334-342.
MLA	常健,et al."水下滑翔蛇形机器人滑翔控制的强化学习方法".机器人 41.3(2019):334-342.

入库方式： OAI收割

来源：沈阳自动化研究所

下载0

水下滑翔蛇形机器人滑翔控制的强化学习方法

其他版本