中国科学院机构知识库网格系统: 基于深度强化学习的低空通信基站规划优化研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于深度强化学习的低空通信基站规划优化研究

文献类型：学位论文


作者	薄云鹏
答辩日期	2025-07-01
文献子类	电子信息硕士
授予单位	中国科学院大学
授予地点	北京
导师	汪敏 ; 潘桂新
关键词	低空通信深度强化学习基站规划网联无人机
学位专业	电子信息
其他题名	Research on Low Altitude Communication Base Station Planning Optimization Based on Deep Reinforcement Learning
英文摘要	随着低空经济的快速发展，网联无人机在物流、巡检、应急等场景的应用日益广泛，然而现有 5G 蜂窝网络因天线零位、垂直覆盖限制及城市建筑遮挡等问题，难以满足低空空域连续覆盖需求。本文针对低空通信基站规划优化问题，提出基于深度强化学习的解决方案，主要研究内容包括：首先，针对低空空地信道建模难题，利用实地测试数据对比分析自由空间传播模型、大气传播模型与射线追踪模型的精度，验证射线追踪模型在低空环境下与其他两种模型相比具有更高的准确性，为后续规划优化奠定基础。针对农村等空旷区域的低空网络基站（Low Altitude Network Base Station, LANBS）区域规划问题，提出了基于优势演员-评论家（Advantage Actor-Critic，A2C）算法的低空基站区域覆盖规划方法（A2C based LANBS Planning Algorithm, ALP）。通过设计离散化状态空间与动作空间，结合成本与覆盖效果设计奖励函数，实现了区域信号全覆盖前提下的新建基站成本最小化目标。仿真结果表明，与其他方法相比，ALP 算法的规划方案在仿真农田场景中成功实现了低成本的信号全覆盖，且信号仿真计算量与需获取全部先验信息的传统规划方法相比减少75.89%，实现了高效的区域低空基站规划。针对城市复杂环境下的多目标优化问题，设计了基于近端策略优化（Proximal Policy Optimization, PPO）的低空基站航线覆盖优化算法（PPO based LANBS Optimization Algorithm, PLO）。通过引入阶梯式奖励函数，联合优化信号接收强度、主服务基站切换次数与基站部署成本。仿真结果显示，在模拟城区航线场景中，PLO 算法将信号接收功率均值由初始状态的-79.30 dBm 提升 9.12 dB到-70.18 dBm，主服务基站切换次数由初始状态的 47 次减少 33 次到仅需切换 14次，同时优化成本较 A2C 算法低 50%，成功实现了多目标协同优化。本文通过理论建模与仿真验证，证明深度强化学习在低空基站规划中的高效性与适应性，为低空通信网络建设提供了新的技术思路，具有重要的工程应用价值。
学科主题	天文学
语种	中文
页码	0
源URL	[http://ir.ynao.ac.cn/handle/114a53/28986]
专题	云南天文台_射电天文研究组
作者单位	中国科学院云南天文台
推荐引用方式 GB/T 7714	薄云鹏. 基于深度强化学习的低空通信基站规划优化研究[D]. 北京. 中国科学院大学. 2025.

入库方式： OAI收割

来源：云南天文台

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。