一种基于Q学习的AUV浮力调节方法
文献类型:专利
| 作者 | 贾松力 ; 林扬 ; 朱兴华 ; 孙铁 ; 孙铁铭
|
| 发表日期 | 2021-12-17 |
| 著作权人 | 中国科学院沈阳自动化研究所 |
| 国家 | 中国 |
| 文献子类 | 发明 |
| 产权排序 | 1 |
| 英文摘要 | 本发明公开了一种基于Q学习的AUV浮力调节方法,包括根据不同AUV的执行机构定义系统环境状态集、根据浮力调节系统的能力及AUV的实际特性定义浮力调节动作集,从而由此形成初始Q表;确定用以更新Q表的奖励机制,根据epsilon贪婪策略选择浮力调节动作,根据产生的奖励更新Q表;学习过程中Q表各状态下最优动作对应的Q值会不断增加,依据充分学习的Q表可选取最优浮力调节动作。 |
| 申请日期 | 2020-06-11 |
| 语种 | 中文 |
| 状态 | 公开 |
| 源URL | [http://ir.sia.cn/handle/173321/30145] ![]() |
| 专题 | 沈阳自动化研究所_海洋信息技术装备中心 |
| 作者单位 | 中国科学院沈阳自动化研究所 |
| 推荐引用方式 GB/T 7714 | 贾松力,林扬,朱兴华,等. 一种基于Q学习的AUV浮力调节方法. 2021-12-17. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。

