中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
构造地貌知识图谱研究——以青藏高原为例

文献类型:学位论文

作者奚镜伦
答辩日期2023-12
文献子类学术型学位
授予单位中国科学院大学
授予地点中国科学院地理科学与资源研究所
导师周成虎
关键词知识图谱 构造地貌 青藏高原
学位名称博士
学位专业地图学与地理信息系统
英文摘要构造地貌是地貌系统的重要组成部分,是连接地表过程和地球深部过程的桥梁,并科学支撑建筑选址、灾害防治等各类生产生活实践,因此,构造地貌的研究具有重要的理论价值与现实意义。同时,构造地貌研究内容广泛,涉及多学科交叉,亟需新的科学方法支持。近年来,人工智能技术推动了众多学科的发展,也为构造地貌研究带来了新的助力。然而,当前的人工智能模型主要依赖于大量数据训练,忽视了学科专家知识,限制了性能的提升。为此,本文结合大数据分析和现代人工智能研究,开创性地开展了构造地貌知识图谱研究,系统梳理了构造地貌知识体系,建立了知识点之间的联系;在研究和建立构造地貌本体的基础上,提出构造地貌知识抽取技术和方法以构建构造地貌知识图谱; 以青藏高原为试验区,尝试开展基于知识图谱的构造地貌研究。论文的主要研究进展和创新如下: (1)构造地貌知识体系的构建。在大量地貌科学论文、专著等文献资料分析和阅读的基础上,提出构造地貌与构造地貌学两个关键概念的定义,梳理了构造地貌学科复杂、多元的知识,建立知识点之间的联系,构建了构造地貌知识体系。 (2)构造地貌本体的构建。根据领域本体的组成以及构造地貌的特点和实际需要,提出了基于七步法改进的构造地貌本体构建方法,并在 Protégé 平台实现了本体自上而下的构建,并通过一系列的本体评价方法来评估本体质量,实现了以计算机可以理解的形式表达构造地貌学科知识。 (3)基于命名实体识别技术的文本知识抽取。使用 BERT-BiLSTM-CRF 模型对构造地貌领域的论文进行命名实体识别操作。对搜集到的一批构造地貌文献进行文本标注,以生成训练数据。在模型的训练过程中,不断对各个超参数进行调优,以获取模型的最佳性能。最后模型的精确率达到了 0.878。 (4)面向 Shapefile 数据的知识抽取工作。针对 Shapefile 数据的格式特点,设计了 Shapefile 数据与知识图谱的映射规则,实现了针对 Shapefile 数据的知识抽取。 (5)面向数字高程模型(Digital elevation model,DEM)的知识抽取。针对DEM 进行基本地貌类型知识的抽取,提出了不同于前人的基于规则与聚类的自动分类方法,使用分类规则与 K 均值算法实现了研究区基本地貌类型的分类,完成了面对 DEM 的知识抽取;应用 30m 分辨率的 DEM,对青藏高原地区按照平原、丘陵、小起伏山地、中起伏山地、大起伏山地与极大起伏山地六种基本地貌类型进行自动分类。 (6)基于知识图谱的断层滑动速率估算。利用知识抽取过程中搜集到的断层数据,以及 DBPedia 知识图谱嵌入数据,提出了一种基于知识图谱的断层滑动速率估算方法,并利用该方法实现了青藏高原近 50 个正断层的滑动速率快速评估,进而分析了青藏高原南北向裂谷的成因。 (7)探索了构造地貌领域知识图谱结合大语言模型在构造地貌研究中的应用。通过向 ChatGPT 提出一系列构造地貌学科问题或与青藏高原构造地貌研究相关的问题,发现了构造地貌知识图谱对大语言模型在构造地貌领域表现效果的增强,以及融合知识图谱的大语言模型善于回答分类等结构化程度高的问题这一优势。
学科主题地图学与地理信息系统
语种中文
页码140
源URL[http://ir.igsnrr.ac.cn/handle/311030/209349]  
专题地理科学与资源研究所_研究生部
推荐引用方式
GB/T 7714
奚镜伦. 构造地貌知识图谱研究——以青藏高原为例[D]. 中国科学院地理科学与资源研究所. 中国科学院大学. 2023.

入库方式: OAI收割

来源:地理科学与资源研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。