中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
特定领域事件图谱构建关键技术研究

文献类型:学位论文

作者孙鸿儒
答辩日期2020-05-22
文献子类硕士
授予单位中国科学院大学
授予地点中科院自动化所
导师杨一平 ; 倪晚成
关键词事件图谱 事件抽取 事件关系抽取 军事战例 依存树 注意力图神经网络
学位名称工学硕士
学位专业计算机应用技术
英文摘要

        军事战例对于总结过去战争经验、指导未来军事作战具有重要作用,是一种非结构化文本描述的重要军事知识源。军事战例中蕴含着大量由动态事件构成过程性知识,传统擅长静态“实体-关系”表达的知识图谱技术,难以刻画事件对实体、事件对时空、事件对事件等更为复杂的情况。随着智能化需求不断提高,人类迫切需要构建一种描述事件的演化规律和发展逻辑的知识载体,因此,挖掘事件之间的关系或网络已经成为新的研究热点,特别是对时间线、逻辑线上一系列事件的抽取,事件图谱的概念便应运而生。
        本文面向战役级军事战例文本的事件图谱构建,针对特定领域图谱构建缺少专用语料库,且事件抽取、事件关系抽取方法缺乏针对性的问题:首先设计了事件定义和事件关系定义的军事作战事件体系,并基于此标注了一定规模的语料;然后利用依存树建立的触发词和论元之间远距离连接,设计了基于注意力图神经网络的事件抽取方法,实现了高密度事件句中的无关噪声过滤;最后设计多层图神经网络模型,从深层语义层面抽取事件之间的时序,逻辑等关系。具体研究内容包括:
        (1)实现军事战例事件语料库构建。针对军事决策研究中作战事件分类模糊,事件粒度较小的特点,结合专家知识,定义了细粒度的作战事件体系。其中包括攻击、准备、防御、收获、损失5个抽象的事件类型,每个抽象类型又分别包含了细粒度的子事件类型(共23个子类),同时为每类事件设计了合理的论元角色。定义了顺承,同时,因果和协同关系4种事件关系类型。并基于上述事件体系,制定了语料标注的规范,完成了183篇文章和7943个事件标注,形成了军事作战事件图谱语料库。
        (2)针对军事战例文本事件密度高、触发词上下文噪声大、论元缺失情况较多的特点,提出了一种基于依存树编码的作战事件抽取算法。算法利用依存树建立了触发词与论元之间的远距离连接,同时借助注意力图神经网络强大的特征提取能力从语义层面获取词的表示,从战例文本中抽取出事件的触发词和论元。相比于传统的序列模型,该模型能够有效降低噪声和序列长度对句子表示的影响,在上述语料库上分别取得了3.4%(触发词抽取)和17.5%(论元抽取)的性能提升。
        (3)针对战例文本中缺少显式的事件关系指示词的问题,以及作战事件关系的类别与论元角色直接相关的特点,提出了一套基于依存树的多层图神经网络的事件关系抽取方法。该方法利用依存树和论元角色建立两个事件触发词之间的远距离连接,通过语义信息去判断事件关系;同时多层图神经网络可以捕捉深层的语义信息,提高事件关系抽取的准确性,有效消除传统的序列模型会捕获很多无关的信息,同时无法考虑论元角色对事件关系类别的影响。实验显示该模型的F1值明显高于基线方法(提升8.4%),可视化的结果分析发现该模型具备关键词捕捉的能力。
        最后,本文基于上述研究成果,实现了一个军事战例事件抽取的原型系统。该系统分成数据预处理,事件抽取,事件关系抽取三大模块,在包含1475个事件和597个有效事件关系的军事战例事件测试集数据上,实现了从事件抽取到事件关系抽取的全流程的验证,构建了36个战役的事件图谱。

语种中文
页码83
源URL[http://ir.ia.ac.cn/handle/173211/39114]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
孙鸿儒. 特定领域事件图谱构建关键技术研究[D]. 中科院自动化所. 中国科学院大学. 2020.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。