深度强化学习在多机对战战术决策中的应用研究
文献类型:学位论文
作者 | 张业胜1,2![]() |
答辩日期 | 2018-05 |
授予单位 | 中国科学院大学 |
授予地点 | 北京 |
导师 | 常红星 |
关键词 | 深度强化学习 机动决策 战术决策 空战仿真 多机协同 |
英文摘要 |
随着无人机在世界各国的快速发展,无人机已经成为不可忽视的军事力量的重要组成部分。无人机的智能化水平是决定无人机整体性能的关键因素之一。深度学习是近10年来发展最为迅猛的学科之一,在文本、语音、图像等领域都有着成功的应用。特别是深度强化学习的引入对人工智能领域产生了深远的影响。本文主要研究将深度强化学习方法应用于无人机对战,旨在提高无人机自主空战战术决策的智能水平。主要工作包括以下几个部分:
1.提出了将深度强化学习应用于1对1空战中的战术机动选择。定义了无人机空战的环境,包括系统状态、可选机动、空战态势评估等;根据经典的能量战术与角度战术设计了系统学习所需的奖赏函数;设计了深度强化学习应用于空战训练的深度学习模型,并进行了多层次的实验,取得了良好的效果。
2.设计了功能丰富的空战仿真系统。定义了多样化的人机接口,可以实现多种空战模拟;对空战模拟及训练中产生的大量数据进行了整理与筛选并持久化存储;充分利用这些存储的数据进行模仿学习,进一步优化了深度神经网络,提高了无人机自主空战战术决策的效果。
3.提出了一种多机编队对战战术决策方法。根据无人机攻击效果的不同,划分了4块不同威胁的区域;设计了多机协同时的目标分配算法;对典型的4对2编队空战进行了仿真,验证了该方法的有效性,提高了多机战术决策的智能化程度。
|
学科主题 | 智能信息系统 |
源URL | [http://ir.ia.ac.cn/handle/173211/21193] ![]() |
专题 | 毕业生_硕士学位论文 |
作者单位 | 1.中国科学院大学 2.中国科学院自动化研究所 |
推荐引用方式 GB/T 7714 | 张业胜. 深度强化学习在多机对战战术决策中的应用研究[D]. 北京. 中国科学院大学. 2018. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。