中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向无人艇的T-DQN智能避障算法研究

文献类型:期刊论文

作者周治国; 余思雨; 于家宝; 段俊伟; 陈龙; 陈俊龙
刊名自动化学报
出版日期2023
卷号49期号:8页码:1645-1655
关键词无人艇 强化学习 智能避障 深度Q网络
ISSN号0254-4156
DOI10.16383/j.aas.c210080
英文摘要无人艇(Unmanned surface vehicle, USV)作为一种具有广泛应用前景的无人系统,其自主决策能力尤为关键.由于水面运动环境较为开阔,传统避障决策算法难以在量化规则下自主规划最优路线,而一般强化学习方法在大范围复杂环境下难以快速收敛.针对这些问题,提出一种基于阈值的深度Q网络避障算法(Threshold deep Q network, T-DQN),在深度Q网络(Deep Q network, DQN)基础上增加长短期记忆网络(Long short-term memory, LSTM)来保存训练信息,并设定经验回放池阈值加速算法的收敛.通过在不同尺度的栅格环境中进行实验仿真,实验结果表明, T-DQN算法能快速地收敛到最优路径,其整体收敛步数相比Q-learning算法和DQN算法,分别减少69.1%和24.8%,引入的阈值筛选机制使整体收敛步数降低41.1%.在Unity 3D强化学习仿真平台,验证了复杂地图场景下的避障任务完成情况,实验结果表明,该算法能实现无人艇的精细化避障和智能安全行驶.
源URL[http://ir.ia.ac.cn/handle/173211/56081]  
专题自动化研究所_学术期刊_自动化学报
推荐引用方式
GB/T 7714
周治国,余思雨,于家宝,等. 面向无人艇的T-DQN智能避障算法研究[J]. 自动化学报,2023,49(8):1645-1655.
APA 周治国,余思雨,于家宝,段俊伟,陈龙,&陈俊龙.(2023).面向无人艇的T-DQN智能避障算法研究.自动化学报,49(8),1645-1655.
MLA 周治国,et al."面向无人艇的T-DQN智能避障算法研究".自动化学报 49.8(2023):1645-1655.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。