基于知识图谱的事实核查增强方法研究
文献类型:学位论文
作者 | 王帅![]() |
答辩日期 | 2022-05-22 |
文献子类 | 博士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 毛文吉 |
关键词 | 事实核查 增强表示学习 领域知识结构 多断言语义组合 语义交互增强 |
学位名称 | 工学博士 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 互联网上的信息传播具有速度快且成本低等特点,这些特点在给人们带来交流的便利性的同时,也造成了虚假信息的大量传播。为了有效地检测虚假信息,事实核查任务旨在利用外部数据源所提供的证据来判断待查事实的真假性。知识图谱作为含有大量的高质量无歧义的事实性知识的结构化知识库,成为事实核查最重要的信息来源。本论文针对基于知识图谱的事实核查展开研究。该课题不但是网络媒体分析、知识推理和文本挖掘等领域的一项重要研究内容,并且在国家与社会公共安全和商业等领域具有较好的应用价值。现有的基于知识图谱的事实核查方法大多在表示学习和事实查验的过程中忽略了知识图谱本身的稀疏性带来的过拟合问题,并且缺乏对领域知识结构等实体间丰富的语义信息的有效利用,因而影响了事实核查方法的性能。此外,现有的事实核查方法只能处理单个断言,而在现实世界中的复杂情形下,待查事实常以多个断言的形式出现。
本论文研究知识驱动与知识增强的表示学习和查验方法,利用知识图谱所提供的外部知识建立结构表示、知识增强与推理计算方法,用于进行单断言和复杂情形下的多断言事实核查。一方面,通过挖掘断言的特征并借助知识的内在结构来设计算法,更好地增强表示学习用于查验单断言的真假性。另一方面,针对复杂情形下的事实查验,学习其整体语义表示并利用语义融合和语义交互增强来更好地学习多断言组合语义,用于多断言事实核查。
本论文的主要贡献与创新点归纳如下:
1.以往研究中忽略了对实体间类别层次信息的有效利用,且由于知识图谱本身的稀疏性带来实体表示学习的过拟合问题。针对以往工作存在的问题,本论文提出一种基于层次原型学习的端到端单断言事实核查方法。该方法将原型学习引入到事实核查任务中,利用实体的类别层次结构增强实体的表示学习,通过为每个类别学得原型表示,并基于原型表示来优化实体的表示学习过程,使得同一类别的实体表示相互靠近,同时不同类别的实体表示彼此远离。实验结果验证了所提出方法的有效性。
2.以往研究在实体的表示学习和事实查验过程中忽略了对知识结构信息的有效利用,因而影响了事实核查方法的性能。针对以往工作存在的问题,本论文提出一种知识结构驱动的单断言事实核查增强方法。该方法利用领域知识结构信息对实体的表示学习和事实查验进行增强,在原型学习的基础上,通过图神经网络聚合实体的属性节点来丰富实体的语义表示,并在以往单一的语义匹配模式基础上设计知识结构驱动的综合查验方法来增强事实查验的效果。实验结果验证了所提出方法的有效性。
3.以往基于知识图谱的事实核查工作都是针对单断言情形,而在现实世界的复杂情形下待查事实常表示为多个断言的形式,而已有的单断言事实核查方法应用于多断言事实核查任务时往往会导致错误的结果。为此,本论文基于语义组合,首次建立了多断言事实核查方法。该方法通过组合多个断言的语义为其学得整体的语义表示用于事实核查,语义组合过程通过扩大图卷积网络的感受野来更好地学习多断言的全局语义表示,同时结合显著性单断言的局部语义表示。实验结果验证了所提出方法的有效性。
4.为了在语义组合的基础上,更好地为多断言学得整体的语义表示,本论文提出一种基于话题信息、细粒度建模多断言之间语义交互的事实核查方法。该方法利用待查事实的话题信息来对多断言的组合语义表示进行增强,以强化学习作为模型框架,从多断言文本中抽取话题信息和文本结构信息来引导多智能体在实体层面聚合语义连贯的断言簇,并利用层次注意力机制融合每个智能体学得的交互语义表示。实验结果验证了所提出方法的有效性。 |
学科主题 | 人工智能 |
语种 | 中文 |
页码 | 120 |
源URL | [http://ir.ia.ac.cn/handle/173211/48515] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 王帅. 基于知识图谱的事实核查增强方法研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。