知识引擎实验室在国家自然科学基金委《Fundamental Research》发表新论文
Wed Dec 01 17:04:22 CST 2021


    AZFT-知识引擎实验室论文“Neural symbolic reasoning with knowledge graphs: Knowledge extraction, relational reasoning, and inconsistency checking”(知识图谱上的神经符号推理:面向知识抽取、关系推理、不一致性检测任务)被 NSFC Fundamental Research录用。该论文作者为陈华钧、邓淑敏、张文、许泽众、李娟和Evgeny Kharlamov。

总述

    知识图谱表示实体对之间的关系,许多现实生活中的问题都可以抽象为知识图谱推理 (KGR)。一方面,传统的KGR方法大都只关注KG生命周期的一个阶段(例如KG补全),而忽略了其他阶段的推理(例如KG抽取)。另一方面,传统的KGR方法,大致可以分为符号推理和神经推理两大类,无法兼顾神经推理的可扩展性和符号推理的可解释性。

    为了解决这两个问题,我们从KG的整个生命周期的视角来更全面地看待KGR,包括KG的抽取、补全和提纯,分别对应三个子任务:知识抽取、关系推理和不一致检测,并提出用神经符号推理的方法来对KG的整个生命周期进行推理。

图1. KG 生命周期中三个子任务所对应的三个子结构的通用神经符号集成框架

    如图1所示,Symbolic KG和Symbolic Rules/Axioms分别将符号事实和规则/公理存储在符号空间中,Neural KG和Neural Rules/Axioms分别将这些符号嵌入到向量空间中。本文中的KG抽取方法——NSKE、KG补全方法——tripletGNN、KG提纯方法——K-NAN就是分别通过嵌入、归纳、解码和演绎来集成这四个模块,以实现对KG整个生命周期的神经符号推理。

方法

    我们的方法主要针对KG生命周期的三个阶段:KG的抽取、补全和提纯,分别对应知识抽取、关系推理、不一致性检测三个子任务,接下来会分别介绍实现这三个子模块的方法。
(1)在“KG抽取阶段”的知识抽取方法:NSKE

    如图1所示,我们提出的知识抽取方法NSKE对应的流程为:

    Symbolic KG ---𝑒𝑚𝑏𝑒𝑑𝑑𝑖𝑛𝑔---> Neural KG ---𝑖𝑛𝑑𝑢𝑐𝑡𝑖𝑜𝑛---> Neural Rules/Axioms ---𝑑𝑒𝑐𝑜𝑑𝑖𝑛𝑔---> Symbolic Rules/Axioms ---𝑑𝑒𝑑𝑢𝑐𝑡𝑖𝑜𝑛---> Symbolic KG.

    NSKE模型的框架如图2所示:

图2. 在“KG抽取阶段”的知识抽取方法NSKE框架

    简单来说,相比于传统的知识抽取(关系抽取和事件抽取)方法,NSKE会利用关系/事件类别之间的关系来进行推理,以辅助抽取过程。比如,关系抽取任务可以利用如下所示spouse和father这两个关系和mother关系之间的关联规则:

    对关系抽取任务,我们利用AMIE等模型来挖掘关系类别之间的关联;对事件抽取任务,我们利用事件关系抽取模型来挖掘事件类别之间的关联。基于这些已有的关联,我们可以利用关系的对象属性推理出更多的关联,比如(A事件,导致,B事件)可以推出(A事件,之前发生,B事件)。

    (2)在“KG补全阶段”的关系推理方法:tripletGNN

如图1所示,我们提出的关系推理方法tripletGNN对应的流程为:

    {Symbolic KG ---𝑒𝑚𝑏𝑒𝑑𝑑𝑖𝑛𝑔--->; Symbolic Rules/Axioms ---𝑒𝑚𝑏𝑒𝑑𝑑𝑖𝑛𝑔---> Neural Rules/Axioms ---𝑑𝑒𝑑𝑢𝑐𝑡𝑖𝑜𝑛--->} Neural KG ---𝑑𝑒𝑐𝑜𝑑𝑖𝑛𝑔---> Symbolic KG.

    tripletGNN模型的框架如图3所示:

图3. 在“KG补全阶段”的关系推理tripletGNN框架

    简单来说,tripletGNN将具有KG中的三元组和公理统一表示为无向无标记图,这区别于传统的方法用有向有标记图来表示KG。我们提出一种存储三元组KG的新方法,而不是使用邻接矩阵,以更好地适应归纳图预测的KG补全任务。其次,我们提出了一种基于图神经网络的方法,增强了新的节点特征交互模块,通过交互矩阵计算以区分链接的推理,以应对公理利用模型的不可知问题。

(3)在“KG提纯阶段”的不一致性检测方法:K-NAN

    如图1所示,我们提出的不一致性检测方法K-NAN对应的流程为:

    Symbolic KG ---𝑒𝑚𝑏𝑒𝑑𝑑𝑖𝑛𝑔---> Neural KG ---𝑖𝑛𝑑𝑢𝑐𝑡𝑖𝑜𝑛---> Neural Rules/Axioms ---𝑑𝑒𝑑𝑢𝑐𝑡𝑖𝑜𝑛---> Neural KG ---𝑑𝑒𝑐𝑜𝑑𝑖𝑛𝑔---> Symbolic KG.

    K-NAN模型的框架如图4所示:

图4. 在“KG提纯阶段”的不一致性检测方法K-NAN框架

    简单来说,K-NAN旨在对三元组的结构信息和三元组中隐含的公理信息进行建模,由一个KG嵌入模块和一个具有五个不一致公理的神经公理网络模块组成。KG嵌入模块主要是将KG中的实体和关系进行向量化表示,神经公理网络模块主要是将KG公理向量化,这里考虑的公理包括:KG中关系的域、范围,不相交、自反和非对称属性。

实验


    我们分别在知识抽取、关系推理、不一致性检测三个子任务上进行实验,以验证在KG整个生命周期进行神经符号推理的性能。

(1)知识抽取

    在知识抽取任务上,我们主要做了关系抽取和事件抽取的性能评估,结果如下表所示:

关系抽取

事件抽取



(2)关系推理
    在关系推理任务上,我们主要做了KG零样本属性链接预测的性能评估,结果如下表所示:


(3)不一致性检测
    在不一致性检测任务上,我们主要做了KG上噪音检测的性能评估,结果如下表所示:

本文作者邓淑敏,浙江大学在读博士,研究方向为低资源场景下知识图谱自动构建关键技术研究及应用。

论文原文

阿里技术 | 达摩院 copyright@2017-2018 阿里巴巴-浙江大学前沿技术联合研究中心《法律声明》
浙公网安备: 33010002000092号
| ICP备案网站信息: 浙B2-20120091-4