水下滑翔蛇形机器人滑翔控制的强化学习方法
文献类型:期刊论文
作者 | 常健2,3![]() ![]() ![]() |
刊名 | 机器人
![]() |
出版日期 | 2019 |
卷号 | 41期号:3页码:334-342 |
关键词 | 强化学习 水下滑翔蛇形机器人 马尔可夫决策过程 循环神经网络 |
ISSN号 | 1002-0446 |
其他题名 | A Reinforcement Learning Method for Gliding Control of Underwater Gliding Snake-like Robot |
产权排序 | 1 |
英文摘要 | 研究了一种强化学习算法,用于水下滑翔蛇形机器人的滑翔运动控制.针对水动力环境难以建模的问题,使用强化学习方法使水下滑翔蛇形机器人自适应复杂的水环境,并自动学习仅通过调节浮力来控制滑翔运动.对此,提出了循环神经网络蒙特卡洛策略梯度算法,改善了由于机器人的状态难以完全观测而导致的算法难以训练的问题,并将水下滑翔蛇形机器人的基本滑翔动作控制问题近似为马尔可夫决策过程,从而得到有效的滑翔控制策略.通过仿真和实验证明了所提出方法的有效性. |
语种 | 中文 |
CSCD记录号 | CSCD:6505296 |
资助机构 | 国家重点研发计划(2017YFB1300101) ; 国家自然科学基金青年基金(61803365) |
源URL | [http://ir.sia.cn/handle/173321/24403] ![]() |
专题 | 沈阳自动化研究所_机器人学研究室 |
通讯作者 | 常健 |
作者单位 | 1.中国科学院大学 2.中国科学院机器人与智能制造创新研究院 3.中国科学院沈阳自动化研究所机器人学国家重点实验室 4.东北大学信息科学与工程学院 |
推荐引用方式 GB/T 7714 | 常健,唐敬阁,张晓路,等. 水下滑翔蛇形机器人滑翔控制的强化学习方法[J]. 机器人,2019,41(3):334-342. |
APA | 常健,唐敬阁,张晓路,&李斌.(2019).水下滑翔蛇形机器人滑翔控制的强化学习方法.机器人,41(3),334-342. |
MLA | 常健,et al."水下滑翔蛇形机器人滑翔控制的强化学习方法".机器人 41.3(2019):334-342. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。