耦合地学知识的无人机遥感入河排口智能识别方法研究
文献类型:学位论文
| 作者 | 伍程斌 |
| 答辩日期 | 2025-06 |
| 文献子类 | 学术型学位 |
| 授予单位 | 中国科学院大学 |
| 授予地点 | 中国科学院地理科学与资源研究所 |
| 导师 | 廖小罕 ; 黄耀欢 |
| 关键词 | 深度学习 地学知识耦合 入河排口 遥感智能识别 空间分布格局 |
| 学位名称 | 博士 |
| 学位专业 | 地图学与地理信息系统 |
| 英文摘要 | 入河排口是指直接或通过管道、沟、渠等通道向河流水体排放废弃水的口门,当排放确定为污水则界定为入河排污口。入河排口作为人为污染物流入河流的最后一道关卡,是流域生态环境保护的重要节点,对其进行科学管理是改善流域生态环境质量的重要工作。但由于入河排口面广量大、分布不均的特点,限制了人工实地排查工作的效率和工作范围,我国因此长期处于“本底不清,情况不明”的不利状况,制约了流域生态环境的全方位有效监管。国家对此高度重视,2024国务院公报发布《入河排污口监督管理办法》明确要求“加强入河排污口监督管理,控制入河污染物排放,保护和改善生态环境”。随着入河排口排查工作的持续推进,建立了入河排口排查、监测、溯源、整治等工作的规范体系,逐渐形成了无人机遥感目视解译与人工实地确认的排查标准。虽然无人机遥感目视解译一定程度上提升了入河排口排查效率,但无论是对人工经验要求较高的目视解译还是无侧重区域的拉网式排查,都无法满足全国大范围流域入河排口高效排查的需求。近年来,深度学习因其强大的特征学习能力,在遥感地物自动识别中得到了广泛的应用。结合遥感与深度学习技术,具有实现大范围、高精度的入河排口智能识别的巨大潜力。本论文以构建入河排口智能识别方法为研究目标,以无人机遥感影像为数据源,采用深度学习方法实现入河排口智能识别,通过土地利用、DSM、河流水系缓冲区、建筑物矢量等数据提取或生成地学知识,并与模型耦合提升模型入河排口识别性能,并基于Google 瓦片数据提取长江流域入河排口数据进行验证,为入河排口排查整治等相关工作提供有效的方法支撑和典型案例。 论文的主要研究内容和成果概括如下: (1)针对入河排口类别样本缺失的问题,构建首套关联地理要素的超高分辨率(0.1 m ~ 0.6 m)多源多尺度入河排口目标检测(Outfall Detection,OD)数据集,涵盖八字口、门字口、涵闸、管道口、渠、汇流和敏感区域,根据形状分为三大类别。数据集中共计包含入河排口样本46087 个,其中无人机样本10008个,Google 瓦片样本36079 个。实验证明,OD 数据集对于YOLO、R-CNN 系列的经典目标检测模型具有较好的适用性,填补了遥感深度学习数据集入河排口类别的空白,为入河排口智能识别相关的研究提供了数据支撑。 (2)构建了针对入河排口识别的空间激活函数(SAF),实现GIS 空间分析方法与目标检测算法的耦合;通过地学注意力机制将地学辅助数据驱动的知识转换为入河排口空间分布概率,提升模型入河排口局部区域关注度。基于空间激活函数和地学注意力机制构建了耦合地学知识的入河排口识别模型(GeoFusion RCNN),实验证明GeoFusion R-CNN 有效提升了入河排口识别性能。以类平均精度(Mean Average Precision, mAP)计算,GeoFusion R-CNN 入河排口在定位框重叠度为50%,50-95%和75%的标准下, !", !":$!和 %!相较基准模型( !", !":$!和 %!分别为,71.1,32.7 和26.1)分别提升至76.5,42.1 和42.5。对于大(large,l)、中(medium,m)、小(samll,s)尺寸的入河排口识别性能, &, '和 (相比基准模型分别提升29.3%,10%和11.6%。对比GeoFusion R-CNN 在无人机数据和Google 瓦片上的识别结果发现,GeoFusion R-CNN 在仅使用Google 瓦片的情况下,性能几乎与基于无人机数据集的最优化Faster R-CNN 入河排口识别性能一致,定位框重叠度为50%入河排口识别平均类别精度 !"分别为70.5 及71.1。验证了地学数据和地学知识的引入,弥补了遥感影像分辨率下降导致的入河排口细节信息丢失的问题,有效提高了入河排口识别性能。 (3)基于GeoFusion R-CNN,使用2023 年Google 万片、OSM 河流水系、土地利用、建筑矢量、NDVI 和NDWI 等数据,在长江流域开展了应用和验证。长江流域共计提取入河排口158,961 个,经验证入河排口识别召回率73.3%,平均定位误差为1.05 米。通过分析长江流域入河排口发现,长江流域下游入河排口数量占比最多(58.6%),中游和上游入河排口占比较差距较小(分别为18.6%和22.8%)。从空间分布格局看,入河排口分布在呈现空间聚集分布特征,游区域主要聚集在二级支流,上游和中游则主要分布于干流和支流(如嘉陵江、金沙江等),并且其分布模型与各省(直辖市)范围内干支流数量的比例存在较高的相关性(相关系数0.92)。 综上,本文分析了入河排口智能识别在数据和方法中存在的问题,及其产生的原因,构建了入河排口目标检测(OD)数据集和耦合地学知识的无人机遥感入河排口智能识别方法(GeoFusion R-CNN),通过实验和应用验证了OD 数据集和GeoFusion R-CNN 方法在大范围入河排口排查工作中的可用性,填补了遥感目标检测入河排口数据集的空白,并为入河排口排查整治工作提供了有效的方法支撑。 |
| 学科主题 | 地图学与地理信息系统 |
| 语种 | 中文 |
| 页码 | 152 |
| 源URL | [http://ir.igsnrr.ac.cn/handle/311030/217358] ![]() |
| 专题 | 地理科学与资源研究所_研究生部 |
| 推荐引用方式 GB/T 7714 | 伍程斌. 耦合地学知识的无人机遥感入河排口智能识别方法研究[D]. 中国科学院地理科学与资源研究所. 中国科学院大学. 2025. |
入库方式: OAI收割
来源:地理科学与资源研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
