基于叙事框架的数据组织关联方法
文献类型:学位论文
作者 | 闭思泽 |
学位类别 | 博士 |
答辩日期 | 2017-05-17 |
授予单位 | 中国科学院研究生院 |
授予地点 | 北京 |
导师 | 黄廷磊 |
关键词 | 叙事理论 冲突事件数据 地理空间叙事 概率语言模型 高斯过程回归 |
学位专业 | 信号与信息处理 |
中文摘要 | 地理空间信息的数据种类繁多、结构复杂、来源广泛,同时数据更新速度快且数量巨大,如何对地理空间情报大数据进行组织关联,从而挖掘出重要价值信息,是国内外相关学者正在开展的研究课题之一。目前国内外已有不少相关研究成果,但现有的数据组织关联方法,在情报信息检索、整理汇编和数据理解等方面表现欠佳,如何提高数据的关联理解能力是情报分析领域急需解决的重要问题。 本文以世界热点地区的冲突事件数据集为研究对象,通过引入叙事框架和叙事相关的背景数据,来提高对冲突事件数据的检索及理解能力。为此着重研究了冲突事件数据的表征及其对应的地理空间叙事方法,形成针对特定问题的模型和算法框架,有效提高了冲突事件数据集中的信息检索和数据理解能力。 论文的主要工作如下: 1. 提出了基于叙事结构的数据组织方法,用于提供一种面向结构化数据组织形式的检索方法。传统表征学习方法,缺少对数据结构特征的考虑,无法对冲突事件数据中故事结构进行表征。针对这一问题,提出了一种基于不对称多维标度法数据索引生成方法,并基于神经概率语言模型对数据的叙事结构进行了学习,能够提供一种面向事件/情节的检索模式。针对数据检索的结果表明,叙事结构对冲突事件数据具有比较好的组织能力及可解释性。 2. 提出了基于叙事过程的数据关联方法,用于提高冲突事件数据在地理空间中的可解释性。基于文本特征及地理位置的数据组织关联,容易导致关联事件数量不足,无法辅助后续分析。针对这一问题,提出了基于像素图的表征模型,来学习文本中的共词特征和语序特征,并基于Kriging空间插值模型对冲突事件的演化过程进行展现。实验在地域、冲突类型及死亡人数分布检索方面,取得了较好的结果。 3. 提出了一种面向人文历史数据的组织关联方法,用于扩展已有的数据框架。由于现有冲突分析模型涉及数据分析场景比较简单,不利于多角度地对冲突过程进行观测及理解。针对这一问题,提出了基于高斯过程回归的数据关联方法,并以人口、教育、GDP、交通路网等数据为例,对已有叙事框架进行了扩展,提供了一种多视角的冲突事件观测手段。实验结果显示出了较高的数据关联准确性及可解释性。 |
学科主题 | 遥感技术 ; Remote sensing |
语种 | 中文 |
公开日期 | 2017-06-07 |
源URL | [http://ir.ie.ac.cn/handle/80137/10988] ![]() |
专题 | 电子学研究所_空间信息处理与应用系统技术院重点实验室_空间信息处理与应用系统技术院重点实验室_学位论文 |
推荐引用方式 GB/T 7714 | 闭思泽. 基于叙事框架的数据组织关联方法[D]. 北京. 中国科学院研究生院. 2017. |
入库方式: OAI收割
来源:电子学研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。