中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于多信息监督与多特征融合的知识图谱表示学习方法研究

文献类型:学位论文

作者周波
答辩日期2020-05-26
文献子类硕士
授予单位中国科学院大学
授予地点远程答辩
导师刘康
关键词知识图谱 表示学习 分布式表示
学位专业模式识别与智能系统
英文摘要

作为人工智能重要的基础设施,知识图谱已经广泛用于诸如智能搜索、用户
意图理解和自动问答等任务中,并且越来越受到研究者们的重视。目前学术界和
工业界的研究人员均在不同领域构建了多种形式的知识图谱,这些图谱有力地
提高了领域内的智能化水平,也大大推动了相关技术的发展。
尽管现有知识图谱已经存储了大量的真实性知识,但是由于现实世界中实
体和关系的数量巨大,因此这些知识图谱仍然稀疏,存在大量关系缺失的现象。
为了发现知识图谱中实体之间的缺失关系,研究人员开始利用知识推理方法进
行知识图谱补全,包括基于逻辑规则的方法和基于表示学习的方法。相较基于逻
辑规则的方法,基于知识图谱表示学习的推理方法具有计算效率高、鲁棒性好的
优点,可有效地缓解数据稀疏的问题,已经被证明可以应用于大规模知识图谱的
补全任务。由此可见,知识图谱表示学习的性能对于知识图谱的补全任务影响巨
大。同时,在深度学习时代,将符号表示的知识向量化,学习其语义表示,也可
有效支撑知识问答、对话系统等其它下游自然语言处理任务。因此,对其研究具
有十分现实的意义。
但是,已有知识图谱表示学习方法仍然存在一些问题,从而影响知识推理的
效果。首先,在表示学习过程中已有大多数方法通常忽略了关系的类别以及三
元组的类别信息,从而影响知识表示的精度;其次,已有大多数知识图谱表示学
习模型,在表示学习过程中忽略了细粒度的线索,即实体与关系的向量表示之
间的细粒度交互,从而无法充分利用编码在实体表示和关系表示中的潜在语义。
针对以上问题,本文在已有工作的基础上提出了解决方法,主要工作如下:
?? 针对忽略了关系类别及三元组类别信息的问题,本文提出一种基于关系
事实类别监督的知识图谱表示方法,利用多任务学习在学习知识图谱中实体、关
系语义表示的同时,融合关系类型和事实类型的信息。具体地,首先将三元组的
多维度得分以不同的权重融合在一起? 然后对于每个三元组,通过构建一个关系
分类器来判断关系的类别,同时学习一个三元组分类器将正三元组与负三元组
区分开来。最后,将关系分类器损失和三元组分类器损失以及知识表示学习损失
放入一个多任务学习框架,共同训练模型。公开数据集上的链接预测实验表明,我们的模型比起其它基准模型可以获得更好的知识图谱表示结果。
?? 针对忽略了实体和关系细粒度交互的问题,本文提出一种融入实体关系
交互机制的知识图谱表示学习方法,通过多头注意力机制和交互机制捕捉实体
表示和关系表示之间的语义关联,从而提升知识图谱表示学习效果。具体地,首
先通过多头注意力机制产生了头实体和关系的多种特征。然后,我们引入交互机
制来计算这些特征与实体之间的匹配分数,并通过融合机制进一步处理这些交
互结果。此外,我们还在计算点积分数时引入非线性变换以更好地建模非线性关
系。最后通过极小化分类损失来学习模型参数。在公开数据集上与多个基准模型
的链接预测的性能相比,我们的模型可取得更好的知识图谱表示结果。

语种中文
页码76
源URL[http://ir.ia.ac.cn/handle/173211/39185]  
专题模式识别国家重点实验室_自然语言处理
推荐引用方式
GB/T 7714
周波. 基于多信息监督与多特征融合的知识图谱表示学习方法研究[D]. 远程答辩. 中国科学院大学. 2020.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。