扩展目标跟踪中基于深度强化学习的传感器管理方法
文献类型:期刊论文
作者 | 张虹芸; 陈辉; 张文旭 |
刊名 | 自动化学报
![]() |
出版日期 | 2024 |
卷号 | 50期号:7页码:1417-1431 |
关键词 | 传感器管理 扩展目标跟踪 深度强化学习 双延迟深度确定性策略梯度 信息增益 |
ISSN号 | 0254-4156 |
DOI | 10.16383/j.aas.c230591 |
英文摘要 | 针对扩展目标跟踪(Extended target tracking, ETT)优化中的传感器管理问题, 基于随机矩阵模型(Random matrices model, RMM)建模扩展目标, 提出一种基于深度强化学习(Deep reinforcement learning, DRL)的传感器管理方法. 首先, 在部分可观测马尔科夫决策过程(Partially observed Markov decision process, POMDP)理论框架下, 给出基于双延迟深度确定性策略梯度(Twin delayed deep deterministic policy gradient, TD3)算法的扩展目标跟踪传感器管理的基本方法; 其次, 利用高斯瓦瑟斯坦距离(Gaussian Wasserstein distance, GWD)求解扩展目标先验概率密度与后验概率密度之间的信息增益, 对扩展目标多特征估计信息进行综合评价, 进而以信息增益作为TD3算法奖励函数的构建; 然后, 通过推导出的奖励函数, 进行基于深度强化学习的传感器管理方法的最优决策; 最后, 通过构造扩展目标跟踪优化仿真实验, 验证了所提方法的有效性. |
源URL | [http://ir.ia.ac.cn/handle/173211/58795] ![]() |
专题 | 自动化研究所_学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 张虹芸,陈辉,张文旭. 扩展目标跟踪中基于深度强化学习的传感器管理方法[J]. 自动化学报,2024,50(7):1417-1431. |
APA | 张虹芸,陈辉,&张文旭.(2024).扩展目标跟踪中基于深度强化学习的传感器管理方法.自动化学报,50(7),1417-1431. |
MLA | 张虹芸,et al."扩展目标跟踪中基于深度强化学习的传感器管理方法".自动化学报 50.7(2024):1417-1431. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。