中国科学院机构知识库网格系统: 基于改进强化学习的多无人机协同对抗算法研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于改进强化学习的多无人机协同对抗算法研究

文献类型：期刊论文


作者	张磊 ; 李姜 ; 侯进永 ; 高远 ; 王烨
刊名	兵器装备工程学报
出版日期	2023-05-25
卷号	44 期号:05 页码:230-238
英文摘要	多无人机的作战协同研究内容主要包含飞行协同、侦察协同及干扰协同，随着无人机数量及协同决策内容的增加，多智能体强化学习模型的状态空间及动作空间维度呈指数增长，多智能体强化学习算法在训练中不易收敛，协同决策水平难以得到显著提升。采用并对多智能体深度确定性策略梯度(MADDPG)算法原理进行模型构建，在此基础上提出了一种选择性经验存储策略的多智能体深度确定性策略梯度(SES-MADDPG)算法。该算法通过设置回收存储标准以及选择性因子，对进入经验池的经验进行选择性存储，以缓解奖励稀疏的问题。仿真实验表明，在保证算法时间复杂度的前提下，SES-MADDPG算法比其他强化学习算法有了更好的收敛效果，相较于MADDPG算法，任务完成率提高了25.427%。
源URL	[http://ir.ciomp.ac.cn/handle/181722/68430]
专题	中国科学院长春光学精密机械与物理研究所
作者单位	1.32802部队 2.中国科学院大学 3.中国科学院长春光学精密机械与物理研究所
推荐引用方式 GB/T 7714	张磊,李姜,侯进永,等. 基于改进强化学习的多无人机协同对抗算法研究[J]. 兵器装备工程学报,2023,44(05):230-238.
APA	张磊,李姜,侯进永,高远,&王烨.(2023).基于改进强化学习的多无人机协同对抗算法研究.兵器装备工程学报,44(05),230-238.
MLA	张磊,et al."基于改进强化学习的多无人机协同对抗算法研究".兵器装备工程学报 44.05(2023):230-238.

入库方式： OAI收割

来源：长春光学精密机械与物理研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。