空间显式的地理随机森林模型优化、验证及应用
文献类型:学位论文
| 作者 | 孙凯 |
| 答辩日期 | 2025-06 |
| 文献子类 | 博士后出站报告 |
| 授予单位 | 中国科学院地理科学与资源研究所 |
| 授予地点 | 中国科学院地理科学与资源研究所 |
| 导师 | 张扬建 ; 诸云强 |
| 关键词 | 地理空间人工智能 空间预测 空间显式模型 机器学习 地理随机森林 空间交叉验证 |
| 学位名称 | 博士后 |
| 学位专业 | 植物生态学 |
| 英文摘要 | 空间预测是地理信息科学的重要研究命题,稳定和精准的空间预测需要考虑地理数据的空间自相关性和空间异质性。在地理空间人工智能大发展的背景下,顾及空间特性的空间显式机器学习模型成为解决空间预测任务的有效方法。地理随机森林是近几年出现的一种空间显式机器学习方法。由于其能够提供更精准的空间预测且具有较高的可解释性,已在生态、环境和健康等领域的空间预测任务中得到广泛应用。然而,该模型在模型构建、训练、预测和验证等方面,仍存在显著缺陷。本文针对该问题开展研究,取得的主要研究成果和结论如下: 1)提出了针对性的地理随机森林模型增强方法,包括:空间自相关引导的超参数确定方法,用于解决现有地理随机森林模型采用网格搜索方法获取最优参数而导致计算复杂度过大的问题;基于Bootstrap的局部训练样本扩充方法,解决少量局部样本所导致的局部模型训练不充分的问题;考虑距离衰减效应的局部预测方法,解决单一邻近模型对异常值敏感性过高的问题。通过实验验证发现,所提出的增强方法能够有效弥补现有地理随机森林模型的缺陷。 2)系统整理了现有空间交叉验证方法,包括:基于聚类、基于网格、基于地理属性和空间留一交叉验证。通过两个案例(基于随机森林的家庭暴力预测和基于神经网络的城市肥胖率预测)对随机交叉验证和空间交叉验证方法进行对比,发现两个案例的结果呈现一致的趋势:与空间交叉验证相比,基于随机交叉验证所取得的模型性能评估结果呈现乐观偏差。 3)以四川省凉山州滑坡灾害敏感性预测和美国纽约州布法罗市暴雪灾害311请求预测为例,开展了地理随机森林模型在自然灾害领域的应用。滑坡灾害预测结果表明地理随机森林模型能够取得比随机森林模型更高的预测精度;暴雪灾害311请求预测结果表明增强后地理随机森林模型能够在大幅缩短超参数调优时间的基础上保持模型的预测精度。 4)以中国地级市PM2.5浓度预测和美国纽约城市肥胖率预测为例,开展了地理随机森林模型在环境健康领域的应用。两个案例的预测结果证明地理随机森林模型能够取得比随机森林模型更高的预测精度,且能够揭示特征重要性在空间上的变化。采用基于shapley值的模型解释方法提升了地理随机森林模型的可解释性。 |
| 语种 | 中文 |
| 页码 | 114 |
| 源URL | [http://ir.igsnrr.ac.cn/handle/311030/217386] ![]() |
| 专题 | 地理科学与资源研究所_研究生部 |
| 推荐引用方式 GB/T 7714 | 孙凯. 空间显式的地理随机森林模型优化、验证及应用[D]. 中国科学院地理科学与资源研究所. 中国科学院地理科学与资源研究所. 2025. |
入库方式: OAI收割
来源:地理科学与资源研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
