面向复杂自然语言空间关系的地理知识图谱构建与嵌入表示方法
文献类型:学位论文
| 作者 | 胡蕾 |
| 答辩日期 | 2025-06 |
| 文献子类 | 学术型学位 |
| 授予单位 | 中国科学院大学 |
| 授予地点 | 中国科学院地理科学与资源研究所 |
| 导师 | 诸云强 |
| 关键词 | 地理知识图谱 自然语言空间关系 地理信息抽取 知识图谱嵌入 提示工程 |
| 学位名称 | 博士 |
| 学位专业 | 地图学与地理信息系统 |
| 英文摘要 | 地理知识图谱作为地理人工智能领域的核心支撑技术,在空间关系推断、地理问答等智能化地理任务中展现出重要的理论价值和应用潜力。它通过语义关联集成多源异构的地理数据,提供灵活且结构化的组织方式,不仅支持地理知识的存储与查询,还能通过知识图谱嵌入进行语义推理,挖掘隐含的地理关系,为地理知识发现与智能化应用提供了新的解决方案。近年来,随着自然语言处理、知识图谱嵌入等技术的快速发展,地理知识图谱已成为支持地理空间应用的重要技术基础。 语义关联是知识图谱区别于其他数据组织形式的核心特征,但现有研究中,地理知识图谱中强大的语义链接能力在地理空间智能应用中并未得到充分发挥,主要体现在以下几个方面:(1)现有地理知识图谱主要依赖预定义schema 表达基本的空间关系,难以充分支持贴合人类表达的自然语言空间关系推断、地理问答等应用;(2)现有的知识图谱嵌入模型主要依赖于建模三元组结构而缺乏对拓扑、方向和距离等空间关系的几何特征的感知,导致模型在空间关系推断和地理实体预测等任务中的表现不符合地理直觉。(3)除了上述几何特征,地理实体类型及其层级语义关系作为地理上下文语义特征也会影响自然语言空间关系的使用,而现有知识图谱嵌入模型没有充分考虑这类语义特征,导致自然语言空间关系推断过程缺乏自然性和灵活性。针对这些挑战,本文面向复杂自然语言空间关系,围绕地理知识图谱的构建与嵌入表示方法,开展了一系列研究,并取得了以下研究成果及结论: (1)针对当前研究中缺乏高质量、以复杂自然语言空间关系关联的地理知识图谱,难以支撑知识图谱语义嵌入以应对下游地理空间任务的问题,本研究提出了一套地理知识图谱构建方案。首先,人工构建了一套高质量的空间关系三元组标注数据集,以弥补现有基准数据集的不足,为模型训练和评估提供了可靠的基础数据。在此基础上,设计了一种基于大语言模型的空间关系三元组抽取方法,通过特定Prompt 设计和少样本学习策略,显著提升了地理实体识别与复杂自然语言空间关系的抽取效果。实验结果表明,该方法在关键评估指标上优于基线模型,空间关系三元组抽取的精度和召回率提升超过40%以上,为构建高质量地理知识图谱提供了可靠技术支持,并为后续地理空间推理与问答任务奠定了坚实基础。 (2)为支持面向复杂自然语言空间关系的地理知识图谱在多种下游地理任务中的应用,本研究提出了一种多源地理数据融合框架,通过地理实体链接和多源异构数据整合两大环节,有效整合了来自Wikidata、Google Maps、GeoNames、OpenStreetMap 等多源异构地理数据。该框架重点整合了地理实体类型语义层次结构和几何信息,实现了多源数据的统一表示与互联互通,显著扩展了面向复杂自然语言空间关系的地理知识图谱,为后续多种地理空间任务提供了丰富的数据支持。 (3)针对现有知识图谱嵌入模型依赖于三元组结构而没有充分考虑拓扑、方向、距离等空间关系的几何特征,导致其在地理场景中的适用性受限问题,本研究提出了一种几何特征增强的知识图谱嵌入方法。该方法通过设计距离函数,将拓扑、方向和距离特征融入知识图谱嵌入的联合训练框架。实验表明,与通用知识图谱嵌入方法相比,本方法显著增强了模型的地理空间感知能力,提升了模型在地理实体预测和空间关系预测任务中的性能,尤其在拓扑特征的影响下。总体而言,MRR 相对基准模型提升10.1%,Hits@1 则相对提升16.8%。此外,模型在预测过程中不仅能够有效过滤错误地理实体,还能发现新的相关实体,弥补了现有方法在地理智能应用中的不足。 (4)地理场景中的地理实体类型作为地理上下文语义特征显著影响着自然语言空间关系的使用。针对现有知识图谱嵌入模型没有充分考虑这一语义特征,本研究将地理实体类型及其语义层次结构作为约束条件,通过联合训练优化知识图谱中地理实体与空间关系在嵌入空间中的分布,从而提升模型在自然语言空间关系推断任务中的表现。实验在两个规模不一的数据集中进行测试,结果表明,该方法显著提升了自然语言空间关系的推断性能,MRR 相对提升29.2%,Hits@N平均相对提升38.6%,尤其在具有长尾地理实体的场景下,此外,模型在大规模数据集中存在噪声的情况下依然表现稳定,展现了较强的鲁棒性。综上所述,本研究面向复杂自然语言空间关系,开展地理知识图谱的构建及其嵌入表示方法研究。从理论基础、方法论到下游地理任务,本研究为空间关系推断、地理问答等智能地理任务提供了更高效、更直观的解决方案。 |
| 学科主题 | 地图学与地理信息系统 |
| 语种 | 中文 |
| 页码 | 130 |
| 源URL | [http://ir.igsnrr.ac.cn/handle/311030/217336] ![]() |
| 专题 | 地理科学与资源研究所_研究生部 |
| 推荐引用方式 GB/T 7714 | 胡蕾. 面向复杂自然语言空间关系的地理知识图谱构建与嵌入表示方法[D]. 中国科学院地理科学与资源研究所. 中国科学院大学. 2025. |
入库方式: OAI收割
来源:地理科学与资源研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
