知识图谱与大模型结合方法概述

时间：2023-11-01 14:38:15浏览次数：37

《Unifying Large Language Models and Knowledge Graphs: A Roadmap》总结了大语言模型和知识图谱融合的三种路线：1）KG增强的LLM，可在LLMs的预训练和推理阶段引入KGs；2）LLM增强KG，LLM可用于KG构建、KG embedding、KG补全、基于KG的文本生成、KBQA（基于图谱的问答）等多种场景；3）LLM+KG协同使用，主要用于知识表示和推理两个方面。该文综述了以上三个路线的代表性研究，探讨了未来可能的研究方向。

知识图谱（KG）和大语言模型（LLM）都是知识的表示形式。 KG是符号化的知识库，具备一定推理能力，且结果可解释性较好。但存在构建成本高、泛化能力不足、更新难等不足。LLM是参数化的概率知识库，具备较强语义理解和泛化能力，但它是黑盒模型，可能编造子虚乌有的内容，结果的可解释性较差。可见，将LLM和KG协同使用，同时利用它们的优势，是一种互补的做法。

知识图谱与大模型结合方法概述_泛化

LLM和KG的融合路线，可分为以下类型：

知识图谱与大模型结合方法概述_知识表示_02

第一种融合路线是KG增强LLM，可在LLM预训练、推理阶段引入KG。以KG增强LLM预训练为例，一个代表工作是百度的ERNIE 3.0将图谱三元组转换成一段token文本作为输入，并遮盖其实体或者关系来进行预训练，使模型在预训练阶段直接学习KG蕴含的知识。

知识图谱与大模型结合方法概述_知识表示_03

第二种融合路线是LLM增强KG。LLM可用于KG构建、KG embedding、KG补全、基于KG的文本生成、KBQA（基于图谱的问答）等多种场景。以KG构建为例，这是一项成本很高的工作，一般包含1) entity discovery 实体挖掘 2) coreference resolution 指代消解 3) relation extraction 关系抽取任务。LLM本身蕴含知识，且具备较强的语义理解能力，因此，可利用LLM从原始数据中抽取实体、关系，进而构建知识图谱。

知识图谱与大模型结合方法概述_知识表示_04

第三种融合路线是KG+LLM协同使用，主要用于知识表示和推理两个方面。以知识表示为例，文本语料库和知识图谱都蕴含了大量的知识，文本中的知识通常是非结构化的，图谱里的知识则是结构化的，针对一些下游任务，需要将其对齐进行统一的表示。比如，KEPLER是一个统一的模型来进行统一表示，它将文本通过LLM转成embedding表示，然后把KG embedding的优化目标和语言模型的优化目标结合起来，一起作为KEPLER模型的优化目标，最后得到一个能联合表示文本语料和图谱的模型。示意图如下：

知识图谱与大模型结合方法概述_泛化_05

小结：上述方法都在尝试打破LLM和KG两类不同知识表示的边界，促使LLM这种概率模型能利用KG静态的、符号化的知识；促使KG能利用LLM参数化的概率知识。从现有落地案例来看，大模型对知识的抽象程度高，泛化能力强，用户开箱即用，体验更好。且如果采用大模型+搜索的方案，用户更新知识的成本也较低，往知识库加文档即可。在实际业务场景落地时，如果条件允许，优先考虑使用大模型。当前chatGPT火爆，也印证了其可用性更好。如遇到以下场景时，可以考虑将LLM和KG结合使用：

• 对知识可信度和可解释性要求高的场景，比如医疗、法律等，可以考虑再建设知识图谱来降低大模型回答错误知识的概率，提高回答的可信度和可解释性。

• 已经有一个蕴含丰富知识的图谱，再做大模型建设时。可以参考KG增强LLM的方法，将其知识融合到LLM中。

• 涉及基于图谱的多跳推理能力的场景。

• 涉及基于图谱可视化展示的场景，比如企查查、天眼查等。

文章来自 PaaS技术创新Lab，PaaS 技术创新Lab隶属于华为云，致力于综合利用软件分析、数据挖掘、机器学习等技术，为软件研发人员提供下一代智能研发工具服务的核心引擎和智慧大脑。我们将聚焦软件工程领域硬核能力，不断构筑研发利器，持续交付高价值商业特性！加入我们，一起开创研发新“境界”！

PaaS技术创新Lab主页链接：<https://www.huaweicloud.com/lab/paas/home.html>

参考文献：

1. Unifying Large Language Models and Knowledge Graphs: A Roadmap <https://arxiv.org/abs/2306.08302>

标签：KG,图谱,模型,知识,概述,LLM,文本
From： https://blog.51cto.com/u_15744961/8121960

【MME编写入门】光照模型
float4x4WorldViewMatrix:WORLDVIEW;float4x4WorldViewProjMatrix:WORLDVIEWPROJECTION;float4x4WorldMatrix:WORLD;//需要用到的矩阵//需要用到光的位置、相机位置float3LightDirection:DIRECTION<stringObject="Light";>;fl......
笛卡尔积、除、(外)连接等重要关系代数求解方法概述
关系代数这部分知识，在软考-数据库部分是比较重要的。有五种基本的关系代数运算，并（符号为V）、差（符号为^）、投影（）、笛卡尔积、选择，补充关系代数运算有，交、连接、除、广义投影、外连接。 1、笛卡尔积，从数学角度理解，就是将集合A和集合B中所有有序对元素集合。 ......
Python用PyMC3贝叶斯模型平均BMA：采样、信息准则比较和预测可视化灵长类动物的乳汁成分
当面对多个模型时，我们有多种选择。模型选择因其简单性而具有吸引力，但我们正在丢弃有关模型中不确定性的信息。 print(f"Runing模型平均一种替代方法是执行模型选择，但讨论所有不同的模型以及给定信息准则的计算值。重要的是要将所有这些数字和测试放在我们问题的背景下，以便我们和......
R语言有限混合模型聚类FMM、广义线性回归模型GLM混合应用分析威士忌市场和研究专利申
最近我们被客户要求撰写关于有限混合模型聚类FMM的研究报告，包括一些图形和统计输出。摘要有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。它们应用于许多不同的领域，例如天文学、生物学、医学或营销。本文给出了这些模型的概述以及许多应用示例。介绍有限混合......
R语言VAR模型的不同类型的脉冲响应分析|附代码数据
最近我们被客户要求撰写关于VAR模型的研究报告，包括一些图形和统计输出。目录模型与数据估算值预测误差脉冲响应识别问题正交脉冲响应结构脉冲反应广义脉冲响应参考文献脉冲响应分析是采用向量自回归模型的计量经济学分析中的重要一步。它们的主要目的是描述模型变量对一个或多个......
Python用PyMC贝叶斯GLM广义线性模型、NUTS采样器拟合、后验分布可视化
尽管贝叶斯方法相对于频率主义方法的理论优势已经在其他地方进行了详细讨论，但其更广泛采用的主要障碍是“可用性”。而使用贝叶斯方法，客户可以按照自己认为合适的方式定义模型。线性回归在此示例中，我们将帮助客户从最简单的GLM–线性回归开始。一般来说，频率论者对线性回归的看......
马尔可夫转换模型研究交通伤亡人数事故时间序列预测|附代码数据
最近我们被客户要求撰写关于马尔可夫转换模型的研究报告，包括一些图形和统计输出。本文描述了R语言中马尔克夫转换模型的分析过程首先，对模拟数据集进行详细建模。接下来，将马尔可夫转换模型拟合到具有离散响应变量的真实数据集。用于验证对这些数据集建模的不同方法。模拟实例示例数......
阿里大模型之通义听悟使用体验
阿里大模型之通义听悟使用体验通义听悟口令见文末~上传音频文件或者直接从阿里云盘选择文件实时记录模式：效果：测试的内容是一场圣经讲道的录音：发言总结内容导出支持情况整体效果还行；部分内容识别错误；可能所选内容分词不是太过常用，是宗教用语；总体效果还是可以的；体验地址：https......
倾斜摄影三维模型数据几何坐标重建方法分析
倾斜摄影三维模型数据几何坐标重建方法分析利用几何坐标变换等技术实现倾斜摄影三维模型数据的坐标重建，可以采用以下方法：1、数据准备：首先，需要获取倾斜摄影影像数据。这些影像应包含多个视角下的拍摄图像，并覆盖同一场景。同时，还需要收集地面控制点的坐标信息，以提供参考和配准......
R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响|附代码数据
全文下载链接：http://tecdat.cn/?p=21506最近我们被客户要求撰写关于TV-PSTR的研究报告，包括一些图形和统计输出。在本文中，当采用两种状态时，单转换函数PSTR模型具有两个变量：我们的经验方法的基础包括评估N个国家的资本流动性。相应的模型定义如下：其中，Iit是第i个国家在时间t时观......

知识图谱与大模型结合方法概述

相关文章

赞助商

阅读排行