中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
水下滑翔蛇形机器人滑翔控制的强化学习方法

文献类型:期刊论文

作者常健2,3; 唐敬阁1,2,3; 张晓路2,3,4; 李斌2,3
刊名机器人
出版日期2019
卷号41期号:3页码:334-342
关键词强化学习 水下滑翔蛇形机器人 马尔可夫决策过程 循环神经网络
ISSN号1002-0446
其他题名A Reinforcement Learning Method for Gliding Control of Underwater Gliding Snake-like Robot
产权排序1
英文摘要研究了一种强化学习算法,用于水下滑翔蛇形机器人的滑翔运动控制.针对水动力环境难以建模的问题,使用强化学习方法使水下滑翔蛇形机器人自适应复杂的水环境,并自动学习仅通过调节浮力来控制滑翔运动.对此,提出了循环神经网络蒙特卡洛策略梯度算法,改善了由于机器人的状态难以完全观测而导致的算法难以训练的问题,并将水下滑翔蛇形机器人的基本滑翔动作控制问题近似为马尔可夫决策过程,从而得到有效的滑翔控制策略.通过仿真和实验证明了所提出方法的有效性.
语种中文
CSCD记录号CSCD:6505296
资助机构国家重点研发计划(2017YFB1300101) ; 国家自然科学基金青年基金(61803365)
源URL[http://ir.sia.cn/handle/173321/24403]  
专题沈阳自动化研究所_机器人学研究室
通讯作者常健
作者单位1.中国科学院大学
2.中国科学院机器人与智能制造创新研究院
3.中国科学院沈阳自动化研究所机器人学国家重点实验室
4.东北大学信息科学与工程学院
推荐引用方式
GB/T 7714
常健,唐敬阁,张晓路,等. 水下滑翔蛇形机器人滑翔控制的强化学习方法[J]. 机器人,2019,41(3):334-342.
APA 常健,唐敬阁,张晓路,&李斌.(2019).水下滑翔蛇形机器人滑翔控制的强化学习方法.机器人,41(3),334-342.
MLA 常健,et al."水下滑翔蛇形机器人滑翔控制的强化学习方法".机器人 41.3(2019):334-342.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。