基于逻辑规则的图谱推理

技术分享 4年前 (2022-05-03) 0 999+

导读： 近年来，知识图谱在众多行业场景被大量应用，例如推荐、医疗。为了构造尽可能完备的图谱，知识图谱的推理工作也成为学术届和工业界的一个重要研究课题。来自Mila人工智能实验室的瞿锰博士，给大家分享了他们在图谱推理任务方向的一个研究：基于逻辑规则的图谱推理（RNNLogic: Learning Logic Rules for Reasoning on Knowledge Graphs），研究结果显示RNNLogic可以很好地兼顾图谱推理任务的模型效果和可解释性的问题。

本文将围绕以下几点展开：

图谱和图谱推理介绍
常见方法和优缺点
逻辑规则学习方法 RNNLogic
工作展望

01 图谱和图谱推理介绍

知识图谱可以看作是我们真实世界中的一些事实的集合，每一条事实可以表示成（h,r,t）或者r(h,t)的形式。比如说我们知道比尔盖茨是微软公司的创始人，我们就可以得到一个（Bill Gates, co-founder of, Microsoft）的3元组组成的事实。在实际生活当中，有众多知识图谱，总结了各个领域的相关知识。

这些知识图谱在很多应用中发挥着重要作用。比如推荐系统中，知识图谱可以帮助我们更好地挖掘用户的兴趣；还有药物再利用方面，对于药物的属性、疾病的属性以及药物和疾病之间关系的已有信息，可以帮助我们去发现新的药物和疾病间的联系，从而更好地去对抗疾病。

不过在实际应用过程中存在的一个问题，图谱信息是不完全的，而补全图谱的人工成本又是非常巨大的，尤其是像是一些医药、金融等一些特定的领域。如果还要考虑知识的动态更新的话，就更加大了图谱补全的难度。

也正是这些问题促成了关系预测这个任务（用来补全图谱），在知识图谱里，关系预测也被称作知识图谱推理。图谱推理的任务就是给定已有图谱，去推理出图谱中的一些缺失的边。比如上图，我们希望能推出红色的边（詹姆斯出生在巴黎）。

02 常见方法和优缺点

1. 图谱表示法

图谱推理最常见的方法是基于知识图谱表示（KG Embedding）的方法，基本思想就是希望把每一个实体或者关系做向量嵌入，通过这些向量表示来进行推断找到缺失的边。

优点：通常能有较好的预测效果。
缺点：模型缺乏可解释性。

2. 归纳逻辑编程法

考虑到图谱嵌入法的可解释性差，我们希望通过学习一些逻辑规则来完成这个任务，提高可解释性。大概的思路是给定已有的知识图谱，我们希望可以从知识图谱里面提取出一些通用逻辑规则，如上图出生地（born in）和城市（city of）两个关系可以用来推断国籍（nationality），再反过来去做关系预测。通过这样的方式，可以使得模型的可解释性更强，而且生成的规则也具有更好的可泛化性。

以上的问题可以通过概率形式建模。如上图所示，我们将这个任务建模分成两部分，生成器（generator）和预测器（predictor）。其中生成器用来生成逻辑规则，预测器将利用生成的规则和已有的图谱去预测最后的答案。对于这样的形式，我们会有不同的方法来解决，其中之一是归纳逻辑编程（Inductive logic programming）。

这种方法的核心是学到一个好的预测器，然后在具体在操作的过程中，他们会利用一个固定的生成器（比如一套逻辑规则的模板）生成出大量的潜在逻辑规则，在预测阶段会给每个潜在的逻辑规则一个权重（weight），最后从所有的逻辑规则里面挑选权重大的规则，当作学习到的比较重要的规则。

优点：整个框架的优化比较简单。
缺点：对规则的搜索空间大，因为固定的生成器。如果想要得到比较好的结果就要尝试大量的逻辑规则，导致效率较低。

3. 基于强化学习的方法

另外一类方法是基于强化学习的方法，其思想和之前的方法是完全相反的，是直接去学习一个生成器，给定一个查询（Query）后可以直接生成一个规则，一旦有了这个规则之后，就可以根据规则定义的关系在知识图谱上去做随机游走，得到我们想要的答案。在这个框架里，只有生成器是可以学习的，预测器是相对简单的，固定的。

优点：预测搜索效率高。
缺点：整个框架的优化很难；依赖KGE（图谱嵌入）的方法来做激励调整。

03 逻辑规则学习方法 RNNLogic

1. 研究背景

在对上面两个方法对比时，我们发现一个方法侧重在学习生成器，另一个侧重学习预测器。我们希望有一种框架，可以同时训练生成器和预测器，也就是RNNLogic的一个核心点。

2. RNNLogic方法

在我们的研究里主要考虑链式的逻辑规则，如上图中所示，可以将链式的逻辑规则变成一个关系序列，其中用END来表示结尾。那很自然的，我们可以通过LSTM来生成这些不同的链式逻辑规则，并输出每一条逻辑规则的概率，进而得到一个弱逻辑规则的集合。

接着我们使用了一个叫做随机逻辑编程（stochastic logic programming）的框架来去定义预测器。会通过生成器的弱关系集合进行游走，如图中所示的两种关系链，第一种可以得到France这个答案，第二个逻辑规则可以得到France，Canada和US三个答案。对于每个潜在答案，我们可以给它定义一个分数，也就是到达这个实体的逻辑规则的weight的和。最后就可以根据分数得到每种答案的概率，挑选出那些概率最大的来当成我们最终的答案。

当前方法的主要难点是如何优化，因为无论是生成器还是预测期，都是动态学习的，所以优化起来可能会有一定难度。而我们发现生成器和预测器两者的难度是不同的，前者由于对后者的依赖，使得生成器是需要依赖于预测器的结果来进行动态调整的，所以生成器会更难些。

为了解决这个难点，我们提出了上图所示的框架。像之前的一些方法，是给定了一个生成器生成了一些逻辑规则送给预测期，让预测器给生成器反馈这个逻辑规则的集合是好还是坏。我们的思路是希望预测器给生成器的反馈更加具体，譬如哪几条规则更重要，从而帮助生成器更好地去更新，得到更好的结果。最后，整个优化的过程可以如下表示：