首页 > 其他分享 >【在RAG系统中应用知识图谱】

【在RAG系统中应用知识图谱】

时间:2024-07-18 18:28:58浏览次数:21  
标签:RAG AI 图谱 模型 知识 查询

【引子】 关于大模型及其应用方面的文章层出不穷,聚焦于自己面对的问题,有针对性的阅读会有很多的启发,本文源自Whyhow.ai 上的一些文字和示例。对于在大模型应用过程中如何使用知识图谱比较有参考价值,特汇总分享给大家。

在基于大模型的RAG应用中,可能会出现不同类型的问题,通过知识图谱的辅助可以在不同阶段增强RAG的效果,并具体说明在每个阶段如何改进答案和查询。知识图谱更类似于结构化数据存储,而不是仅仅是一个用于各种目的的结构化数据的一般存储,可以利用它在 RAG 系统中战略性地注入人类推理。

1. RAG简介

对于复杂的 RAG 和多跳数据检索的一般场景,如下图所示, 关于RAG的更多信息可以参考《[大模型系列——解读RAG]》。

使用上图所示的阶段来介绍知识图谱支持的 RAG 过程中不同的步骤:

  • 阶段1——预处理: 这指的是在查询被用于帮助从向量数据库中提取数据块之前对其进行处理
  • 阶段2/D——数据块提取: 这是指从数据库中检索最相关的信息块
  • 阶段3-5——后处理: 这指的是为准备检索到的信息以生成答案而执行的过程

在不同阶段应该使用哪些知识图谱技术呢?

2.知识图谱在RAG各阶段的应用
2.1 阶段一:查询增强

查询增强是 在从向量数据库中进行检索之前,向查询添加上下文。此策略用于在缺少上下文的情况下增加查询并修复错误查询。这也可以用来注入一个我们的世界观,明确如何定义或看待某些共同或基础术语。

在许多情况下,我们可能对特定术语有自己的世界观。例如,一家旅游科技公司可能希望确保开箱即用 LLM 能够理解“海滨”住宅和“靠近海滩”住宅代表非常不同类型的房产,不能互换使用。在预处理阶段注入这个上下文有助于确保 RAG系统中的这种区别能够提供准确的响应。

从历史上看,知识图谱在企业搜索系统中的一个常见应用是帮助建立首字母缩略词词典,以便搜索引擎能够有效地识别提出的问题或文档/数据存储中的首字母缩略词。这在第一阶段可以用于多跳推理。

2.2 阶段二:数据块提取

文档层次结构是指创建文档层次结构和在向量数据库中导航块的规则。这用于快速识别文档层次结构中的相关块,并使我们能够使用自然语言创建规则,规定查询在生成响应之前必须引用哪些文档/块。

此阶段我们可以使用多个知识图谱。一个知识图谱可以是文档描述的层次结构,引用存储在向量数据库中的块。第二个知识图可以用于规则导航文档层次结构。例如,考虑一个风险基金的 RAG 系统。我们可以写一个自然语言规则,确定性地应用于查询规划代理“回答一个关于投资者义务的问题,首先检查投资者在投资组合清单中投资了什么,然后检查该投资组合的法律文件。”

上下文字典创建用于在向量数据库中导航块的概念结构和规则,有助于理解哪些文档块包含重要主题。这类似于书后的索引。上下文词典本质上是元数据的知识图谱。此字典可用于维护块导航规则,可以包括一个自然语言规则,例如“任何与快乐概念相关的问题,你必须详尽地搜索所有相关的数据块,由上下文字典定义。由 Query Planning Agent 中的 LLM 代理将其转换为知识图谱的查询,以增加要提取的块。这种规则的建立还可以确保块提取的一致性。

这与简单的元数据搜索有何不同?除了提高速度之外,如果文档是简单的,可能意义不大。但是,在某些情况下,我们可能希望确保将特定的信息块标记为与某个概念相关,即使该概念可能未在该块中提及或暗示。这可能发生在讨论正交信息(即与特定概念有争议或不一致的信息)的情况。上下文词典使得与不明显的信息块建立明确的关联变得容易。

2.3 阶段三:递归知识图谱查询

这是用来结合信息提取和存储连贯的答案。LLM 向知识图谱查询答案。这在功能上类似于CoT过程,其中外部信息存储在知识图谱中,以帮助确定下一步的调查。

基本上是一次又一次的运行数据块提取,检索提取的信息,并存储在一个知识图谱中,以强制连接来揭示关系。建立关系并将信息保存在知识图谱中之后,再次使用从知识图谱中提取的完整上下文运行查询。如果上下文不足,请再次将提取的答案保存在相同的知识图谱中,以强制执行更多的连接并清洗。

如果数据不断地流入系统,并且希望确保随着时间的推移使用新的上下文更新答案,那么这一点尤其有用。

2.4 阶段四之一:响应增强

响应增强是根据最初从矢量数据库生成的查询添加上下文。这用于添加必须存在于任何答案中的附加信息,这些附加信息涉及一个未能检索到或在矢量数据库中不存在的特定概念。这对于在基于提到或触发的某些概念的回答中包含免责声明或警告特别有用。

一个有趣的推测途径也可以包括使用答案增强作为一种方式,对于面向消费者的 RAG 系统,当某些答案提到某些产品时,可以包含个性化广告的答案。

2.5 阶段四之二:响应规则

响应规则是根据知识图谱设置的规则重新排序。这是用来强制执行关于可以生成的答案的一致规则。这对信任和安全有影响,我们可能希望消除已知的错误或危险的答案。

Llamaindex 有一个有趣的例子,它使用维基百科的知识图谱来复核一个 LLM 的基本真理。尽管 Wikipedia 不能作为内部 RAG 系统的基本事实的来源,但是您可以使用客观的行业或常识知识图谱来防止 LLM 的幻觉。

2.6 阶段五:数据块访问控制和个性化

知识图谱可以强制执行关于用户可以根据其权限检索哪些块的规则。例如,假设一家医疗保健公司正在构建一个 RAG 系统,该系统包含对敏感临床试验数据的访问。他们只希望拥有特权的员工能够从向量存储中检索敏感数据。通过将这些访问规则作为属性存储在知识图谱的数据上,它们可以告诉 RAG 系统只检索特权块(如果允许用户这样做的话)。

知识图谱可用于为用户的每个响应实现个性化。例如,考虑一个企业 RAG 系统,如果希望为每个办公室的每个员工、团队或部门定制响应。当生成一个答案时,RAG 系统可以咨询 知识图谱,以了解哪些块包含基于用户角色和位置的最相关信息。

我们需要同时包含上下文,以及上下文对于每个答案意味着什么。然后,可能希望将该上下文作为提示或答案增强包括在内。该策略可以建立在块访问控制的基础上。一旦 RAG 系统确定了与该特定用户最相关的数据,它还可以确保该用户确实拥有访问该数据的权限。

3.一个用例

用医学领域的一个例子来进一步阐述RAG系统中如何应用知识图谱。示例问题如下: “阿尔茨海默病治疗的最新研究是什么?” 然后可以采取以下步骤,以知识图谱增强RAG 系统。我们不认为每个 RAG 系统都必须需要以下所有步骤,但这些用例在复杂的 RAG 用例中相对常见。

在这里,描述知识图谱在所有技术(查询增强、数据块提取规则、递归知识图谱查询、响应增强、响应控制、块访问控制)环节的应用示例。

3.1 查询增强

对于“阿尔茨海默氏症治疗的最新研究是什么?” 这个query,通过访问知识图谱,LLM 代理可以持续检索关于最新的阿尔茨海默病治疗的结构化数据,如“胆碱酯酶抑制剂”和“盐酸美金胺”,RAG 系统将进一步提出更具体的问题: “关于胆碱酯酶抑制剂和盐酸美金胺治疗阿尔茨海默病的最新研究是什么?”

3.2 文件层次和矢量数据库检索

使用文档层次结构,识别哪些文档和数据块与“胆碱酯酶抑制剂”和“盐酸美金胺”最相关,并返回相关的答案。

关于“胆碱酯酶抑制剂”的相关块提取规则有助于指导查询引擎提取最有用的块。文档层次结构帮助查询引擎快速识别与副作用相关的文档,并开始提取文档中的块。上下文字典帮助查询引擎快速识别与“胆碱酯酶抑制剂”相关的块,并开始提取与此主题相关的块。一条关于“胆碱酯酶抑制剂”的既定规则指出,查询胆碱酯酶抑制剂的副作用也应检查与 X 酶相关的块。这是因为 X 酶是一个众所周知的副作用,不能被忽略,并相应地包括相关的块。

3.3 递归知识图谱查询

使用递归知识图谱查询,初始查询返回称为“ XYZ 效应”的“记忆时间”的副作用。“ XYZ 效应”作为上下文存储在一个单独的知识图中,用于递归上下文。LLM 被要求使用 XYZ 效果的附加上下文检查新增加的查询。根据过去格式化的答案来衡量结果,它确定需要更多关于 XYZ 效应的信息来构成一个令人满意的答案。然后,它在知识图谱中的 XYZ 效应节点内执行更深入的搜索,从而执行多跳查询。

在 XYZ 效应节点中,它发现关于临床试验 A 和临床试验 B 的信息,它可以包括在答案中。

3.4 数据块控制访问

尽管临床试验 A & B 都包含有益的上下文,但是与临床试验 B 节点相关的元数据标签指出,用户对该节点的访问受到限制。因此,一个常设的控制访问规则可以防止临床试验 B 节点被包含在对用户的响应中。

只有关于临床试验 A 的信息才会返回给 LLM,以帮助其制定返回的答案。

3.5 响应增强

作为后处理步骤,还可以选择使用特定于医疗行业的知识图谱来增强后处理输出。例如,您可以包括特定于盐酸美金胺治疗的默认健康警告,或包括与临床试验 A 相关的任何其他信息。

3.6 数据块个性化

由于用户是研发部门的初级员工,临床试验 B 的信息不对用户开放,所以附加了一个说明,禁止用户访问临床试验 B 的信息,并要求向高级经理询问更多信息。

4. 一点思考

使用知识图谱而非向量数据库进行查询增强的一个优点是,知识图可以对已知关系的某些关键主题和概念进行一致性检索。我们把个性化定义为用户和矢量数据库之间信息流的控制,但是个性化也可以理解为用户特征的封装。

知识图谱可以反映更广泛的用户特征集合的存储,可以用于一系列的个性化工作。在某种程度上,一个知识图谱是一个外部数据存储(即外部 LLM 模型) ,它更容易以一致的形式提取(即知识图谱数据能够以一种更模块化的方式插入,播放和删除)。如果实现了物联网中的数字孪生,知识图谱很可能成为代表这种系统和模型之间的模型个性化的最佳手段。

如何系统的去学习大模型LLM ?

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来

标签:RAG,AI,图谱,模型,知识,查询
From: https://blog.csdn.net/2401_85375186/article/details/140529087

相关文章

  • C++中关于异常的知识点
    C++中关于异常的知识点异常基本概念异常处理的基本思想C++异常处理的实现异常基本语法栈解旋(unwinding)异常接口声明异常变量生命周期异常的多态使用C++标准异常库标准库介绍编写自己的异常类异常基本概念异常是一种程序控制机制,与函数机制独立和互补函数是一......
  • 看看我发现了什么好东西!FlowUs知识库还有“就业服务站点”?!
    不得不说,FlowUs的知识库内容是在是太丰富了,浏览了一下,发现真有能帮助毕业生的就业信息分享+人才政策汇总等我需要的信息......
  • FlowUs的愿景远不止于简单的信息存储和阅读,而是致力于构建一个平台,让用户可以自由创作
    FlowUs在2024年以全新的姿态和强大的功能,为个人和团队带来了更高效、便捷和创新的工作体验。作为一款综合性的工作平台,FlowUs融合了笔记、项目管理、文档协作等多种功能,旨在满足用户在不同场景下的需求,成为提升工作效率和创造力的得力助手。......
  • java基础知识(3)—关键字
    在Java编程的广阔领域中,关键字宛如一把把精确的工具,赋予开发者准确表达意图和实现复杂逻辑的能力。访问控制关键字:private:确保变量、方法或内部类仅在所属的类内部可访问,为数据提供了最高级别的隐私保护。protected:在继承关系中,允许子类和同一包中的类访问特定的成员。pu......
  • 5-3知识图谱推理-基于Ontology的推理
    基于符号逻辑的知识图谱推理方法基于Ontology的推理:      RDF→ResourceDescriptionFramework(资源描述框架):             三元组:subject(主)->predicate(谓)->object(宾)            基于RDF和RDFS的简单推理:             ......
  • bug相关理论知识
    bug包含的内容:1、所属产品2、所属项目3、所属模块4、影响版本5、当前指派6、bug类型7、bug标题8、bug严重级别9、bug优先级10、重现步骤11、相关联需求bug类型:(1)代码错误(2)界面优化(3)配置相关(4)安装部署(5)安全相关(6)性能问题(7)标准规范(8)测试脚本(9)其他bug严重级别b......
  • 关于Iphone的越狱、绕过激活锁ID相关知识备忘
    很少对苹果设备进行越狱,所以相关知识也不甚了解。这里记录一下备忘。恢复模式和DFU模式恢复模式(RecoveryMode)和DFU模式(DeviceFirmwareUpgradeMode)是苹果iOS设备中两种不同的维护和修复模式,主要用于在遇到软件问题时恢复设备。以下是两者的主要区别和用途:恢复模式(Recove......
  • LangChain补充四:Agent知识点和案例补充
    https://www.alang.ai/langchain/101/lc07一:基本流程和概念(一)概念LangChainAgent的核心思想是,使用大语言模型选择一系列要执行的动作。在Chain中,一系列动作是硬编码在代码中的。在Agent中,大语言模型被用作推理引擎,以确定要采取的动作及其顺序。它包括3个组件:规划:将任......
  • JS基础知识总结(3)
    一、让我们的字符串反转:思路就是我们先把它分割成一个个数组,然后我们使用数组的反转,然后我们再把这个数组连接再一起。合起来,样子就是这样的:document.getElementById("result").innerHTML=end_Num.split("").reverse().join("");二、整除有两种方法,一个是parseInt(),还有一......
  • 知识图谱与LLMs:实时图分析(通过其关系的上下文理解数据点)
    大型语言模型(LLM)极大地改变了普通人获取数据的方式。不到一年前,访问公司数据需要具备技术技能,包括熟练掌握各种仪表板工具,甚至深入研究数据库查询语言的复杂性。然而,随着ChatGPT等LLM的兴起,随着所谓的检索增强型LLM应用程序的兴起,隐藏在私人数据库中或可通过各种AP......