基于强化学习的波动鳍推进水下作业机器人悬停控制
文献类型:期刊论文
作者 | 马睿宸1,3![]() ![]() ![]() ![]() ![]() |
刊名 | 控制理论与应用
![]() |
出版日期 | 2022-11 |
卷号 | 39期号:11页码:2022-2099 |
关键词 | 水下作业机器人 悬停控制 波动鳍 神经网络 强化学习 |
DOI | 10.7641/CTA.2022.11054 |
英文摘要 | 本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究. 首先, 给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数–力映射模型, 建立了基于马尔可夫决策过程的悬停控制训练框架. 其次, 基于模型结构和训练策略, 使用强化学习的方法进行网络训练, 得到最佳的悬停控制器. 最终, 在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验, 实验结果验证了所提方法的有效性. |
语种 | 中文 |
源URL | [http://ir.ia.ac.cn/handle/173211/52353] ![]() |
专题 | 智能机器人系统研究 |
通讯作者 | 白雪剑 |
作者单位 | 1.中国科学院大学 2.中国科学院大学,人工智能学院 3.中国科学院自动化研究所,复杂系统管理与控制国家重点实验室 |
推荐引用方式 GB/T 7714 | 马睿宸,白雪剑,王宇,等. 基于强化学习的波动鳍推进水下作业机器人悬停控制[J]. 控制理论与应用,2022,39(11):2022-2099. |
APA | 马睿宸,白雪剑,王宇,王睿,&王硕.(2022).基于强化学习的波动鳍推进水下作业机器人悬停控制.控制理论与应用,39(11),2022-2099. |
MLA | 马睿宸,et al."基于强化学习的波动鳍推进水下作业机器人悬停控制".控制理论与应用 39.11(2022):2022-2099. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。