中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于自主学习的水空跨域海洋机器人运动控制方法研究

文献类型:学位论文

作者霍雨佳1,2
答辩日期2020-08-28
授予单位中国科学院沈阳自动化研究所
授予地点沈阳
导师封锡盛 ; 李一平
关键词水下机器人 倾转旋翼机器人 自主学习 高斯过程回归
学位名称博士
学位专业机械电子工程
其他题名Self-learning Motion Control for Water-air Cross-domain Marine Robot
英文摘要水空跨域海洋机器人作为一种新型机器人,结合了无人机的高机动性和水下机器人的隐蔽性,极大地扩展单一的一种机器人的工作领域。这种融合了多种无人系统特点的,由单一平台组成并实现工作的无人系统,避免了空中、水面和水下协同工作带来的任务复杂性和低可靠性,代表了海上无人系统的发展趋势。本文以一种新型水空跨域海洋机器人为平台,该平台借鉴了倾转旋翼机器人的结构特点,具备水下航行、水面垂直起飞和空中固定翼飞行等工作模式。跨域海洋机器人具有多种介质下的工作环境,其结构根据不同的任务需求改变。同时,跨域机器人也受到未知环境下扰动的影响,因此预先建立一套完备精确的机器人控制模型是困难的,这些机器人系统的模型不确定性也给跨域海洋机器人的运动控制精度提出了挑战。因此需要研究智能化的控制方法,解决跨域机器人在未知环境下的复杂系统的控制问题。为此,本文建立了跨域海洋机器人系统模型,搭建一套跨域海洋机器人的训练仿真平台,提出了基于强化学习的机器人运动控制的训练学习方法,提出了先进的模型学习方法,并且基于模型学习方法研究了跨域海洋机器人的运动控制问题。本文研究内容包括如下4个方面。(1)跨域海洋机器人运动建模与仿真环境。基于跨域机器人的倾转旋翼特性,分析了跨域倾转机器人在各工作介质下的受力,特别的,分析了跨域机器人在水空跨域过程中机体的受力问题,建立了结合倾转旋翼和升力体机翼等结合的动力学模型。并以此为基础,搭建了基于ROS和Gazebo的机器人动力仿真训练平台,为下一步跨域海洋机器人的运动控制仿真训练提供了基础。(2)基于强化学习的跨域海洋机器人运动控制方法研究。为解决机器人控制系统因先验知识的不完备影响运动控制性能,采用利用深度强化学习方法,通过机器与环境间的交互训练,对跨域机器人在空气中以四旋翼模式、固定翼模式和水中以水下机器人模式工作的位置控制和连续路径跟踪问题进行研究。同时,对机器人以倾转旋翼过渡模式下的姿态稳定和高度稳定进行了仿真研究。在此基础上,利用循环神经网络对原有的深度强化学习方法进行改进,解决了实际问题中因机器人传感器受限等问题造成状态部分可观问题。仿真表明,该方法可以在对机器人控制模型缺乏准确认知的情况下,利用机器人与环境的不断交互训练,实现跨域机器人的无模型运动控制问题。(3)基于高斯过程的模型学习方法研究。为降低机器人在未知工作环境下的模型不确定性,提高机器人对环境的扰动的适应性,利用跨域机器人在未知环境下运动状态的观测数据,研究了具有非参数化的高斯过程回归模型。该方法能够降低噪声对观测数据的影响,进而实现系统模型的非参数化高精度辨识。为提高高斯过程在数据量较大情况下的计算速度,建立了基于局部高斯过程回归的模型学习方法。根据局部学习理论,针对复杂系统的模型学习,该局部高斯过程的模型学习方法具有学习速速快、辨识精度高和鲁棒性强的特点。(4)基于模型学习的跨域海洋机器人运动控制方法研究。基于无模型强化学习的运动控制训练是非常耗时费力的,此外,在机器人与环境的交互训练过程中,跨域机器人的安全性也无法得到保障,这使得基于无模型的强化学习算法在运用到实际的机器训练变得十分困难。采用基于Dyna框架的基于模型学习的运动控制训练方法,使得机器人通过与环境交互获取实际经验的同时,这些数据会被机器人利用模型学习方法得到环境的估计模型,在机器人作业的同时,该模型会运行产生虚拟样本用来更新控制策略。这样,机器人不是通过直接的与真实环境进行交互获得控制策略的知识,而是在后台,与在线构建的虚拟环境模型进行交互,训练得到当前环境下的控制策略。该方法能够加快收敛速度,迅速找到最优解的同时,保证了机器人在实际工作环境下的安全性。并通过仿真获得验证,实现跨域倾转机器人在环境扰动下由水和空气间的跨域运动、水面垂直起降、倾转过渡和固定翼飞行的全过程工作仿真,证明了该方法的有效性。
语种中文
产权排序1
页码114页
源URL[http://ir.sia.cn/handle/173321/27985]  
专题沈阳自动化研究所_水下机器人研究室
作者单位1.中国科学院大学
2.中国科学院沈阳自动化研究所
推荐引用方式
GB/T 7714
霍雨佳. 基于自主学习的水空跨域海洋机器人运动控制方法研究[D]. 沈阳. 中国科学院沈阳自动化研究所. 2020.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。