首页 > 数据库 >《向量数据库指南》深度解析:GraphRAG如何精准应对不同类型的查询

《向量数据库指南》深度解析:GraphRAG如何精准应对不同类型的查询

时间:2024-10-26 17:52:46浏览次数:3  
标签:文本 GraphRAG 用户 Community Entity 响应 向量 查询 精准

查询

GraphRAG 有两种不同的查询工作流程,针对不同类型的查询进行了优化:

  • 全局搜索:通过利用 Community 摘要,对涉及整个数据语料库的整体性问题进行推理。

  • 本地搜索:通过扩展到特定 Entity 的邻居和相关概念,对特定 Entity 进行推理。

这个全局搜索工作流程包括以下几个阶段:

(图片来源:https://microsoft.github.io/graphrag/)

  1. 用户查询和对话历史:系统将用户查询和对话历史作为初始输入。

  2. Community 报告分批:系统使用由 LLM 从 Community 层次结构的指定级别生成的节点 Community 报告作为上下文数据。这些 Community 报告被打乱并分成多个批次(打乱的 Community 报告批次 1、批次 2... 批次 N)。

  3. RIR(评级中间响应):每批 Community 报告进一步被划分为预定义大小的文本块。每个文本块用于生成一个中间响应。响应包含一个信息片段列表,称为点。每个点都有一个数值分数,表示其重要性。这些生成的中间响应是评级中间响应(评级中间响应 1、响应 2... 响应 N)。

  4. 排名和过滤:系统对这些中间响应进行排名和过滤,选择最重要的点。选定的重要点形成聚合的中间响应。

  5. 最终响应:聚合的中间响应被用作上下文以生成最终回复。

当用户提出关于特定 Entity(如人名、地点、组织等)的问题时,我们建议使用本地搜索工作流程。这个过程包括以下步骤:

(图片来源:https://microsoft.github.io/graphrag/)

  1. 用户查询:首先,系统接收用户查询,这可能是一个简单的问题或更复杂的查询。

  2. 搜索相似 Entity:系统从知识图中识别出与用户输入语义相关的一组 Entity。这些 Entity 作为进入知识图谱的入口点。这一步骤中使用像 Milvus 这样的向量数据库进行文本相似性搜索。

  3. Entity-文本单元映射:提取的文本单元被映射到相应的 Entity,移除原始的文本信息。

  4. Entity-关系提取:这一步提取关于 Entity 及其相应关系的特定信息。

  5. Entity-协变量(Covariate)映射:这一步将 Entity 映射到它们的协变量,这可能包括统计数据或其他相关属性。

  6. Entity- Community 报告映射:Community 报告被整合到搜索结果中,纳入一些全局信息。

  7. 利用对话历史:如果有对话历史,系统使用对话历史来更好地理解用户的意图和上下文。

  8. 生成响应:最后,系统根据前几步生成的经过过滤和排序的数据生成并响应用户查询。

标签:文本,GraphRAG,用户,Community,Entity,响应,向量,查询,精准
From: https://blog.csdn.net/qinglingye/article/details/143108391

相关文章

  • python实战(三)——文本向量化/文本表示
    一、概念    文本向量化是自然语言处理领域的重要环节,也是现在大语言模型开发重要基础。计算机程序无法理解文字信息(实际上非数值类型的信息都无法理解),因此我们需要将文字信息转换成计算机程序可理解的数值类型。通俗来说就是我们的算法模型是一系列函数和公式的组合......
  • LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势
    近年来,大型语言模型(LargeLanguageModels,LLMs)在自然语言处理领域取得了显著进展。受此启发,研究人员开始探索将LLMs应用于时间序列预测任务的可能性。由于时间序列数据与文本数据在特征上存在显著差异,直接将LLMs应用于时间序列预测仍面临诸多挑战。为了解决这一问题,Jin等......
  • FaceRate.ai:精准的面部评分与深度分析,为你的外貌带来全新视角
    摘要:FaceRate.ai是一款面部分析工具,通过精准评分和黄金比例测试,帮助用户深入了解自己的面部特征。它不仅适合个人提升外貌认知,还为美容师、设计师、艺术家等提供创作灵感。FaceRate.ai:面部分析的智能伴侣全面的面部特征评分与分析在FaceRate.ai,你可以获得从眼睛、鼻子、嘴巴......
  • 向量正交
    过原点的两向量\(u\)与向量\(v\)垂直相当于点\(a\)到点\(b\)的距离与点\(a\)到点\(-b\)的距离相等,也即它们的距离的平方相等。计算点\(a\)到点\(-b\)的距离:\(\begin{align}[distance(a,-b)]^2&=\lVertu-(-v)\rVert^2=\lVertu+v\rVert^2\\&=(u+v)\cdot(u+v)\\&=u\cdot(u+......
  • 向量
    在数学中,向量(也称为矢量),是指具有大小和方向的量;书写向量时,水平书写的向量叫做行向量向量的大小就是向量的长度,也叫做模。向量的方向描述了空间中向量的指向;向量中的数表达了向量在每个维度上的有向位移。特殊向量零向量:大小为0,没有方向的向量,并且它不可以被归一化。单位向......
  • 「深度解析」向量召回和字面召回用法和组合
        上面图中的5个问题,是每个使用大模型进行知识库搭建的时候都要遇到问题,这些问题基本上就决定了问答答案的准确性,本篇文章我们先不讨论上面五个问题的解决方案,我们今天重点讨论两种召回方式:字面召回和向量召回, 字面和向量召回都是搜索召回中的重要方法,如何更好地权......
  • 精准查询车险记录,VIN解析查询服务
    为什么要通过VIN查询车险记录?在购买二手车时,车险记录是一个非常重要的参考指标。它可以帮助您了解车辆是否发生过重大事故、是否有过频繁的维修记录,甚至可以推测出车辆的实际使用情况。通过VIN查询车险记录,您可以:精准了解车辆历史:通过车险记录,您可以清楚地知道车辆是否有......
  • 京准电钟:NTP时间同步服务器助力精准计算机数据网络
    京准电钟:NTP时间同步服务器助力精准计算机数据网络京准电钟:NTP时间同步服务器助力精准计算机数据网络京准电子科技官微——ahjzsz摘要:首先对计算机网络时间同步相关技术进行了介绍,然后阐述了时间同步技术在现代计算机网络中的应用与发展,最后指出时间同步网络在下一代网络(......
  • 打造地下空间精准评价体系,服务城市地下合理开发
    为贯彻党的二十大和二十届二中、三中全会精神,落实《中共中央办公厅国务院办公厅关于全面加强资源节约工作的意见》,统筹推进城市地下空间合理开发利用,充分挖掘地下空间资源潜力,提高土地要素配置的精准性和利用效率,使优势地区有更大发展空间,增强城市综合承载能力,促进经济社会高......
  • 纷享销客CRM“标签管理”助力企业精准营销业绩增长
    在数字化驱动的商业世界中,数据管理无疑是企业铸就成功的核心要素。它能够帮助企业精准洞察市场趋势,深度了解客户需求,进而优化业务流程,并在激烈的市场竞争中崭露头角。然而,在实际的业务场景中,还尚存这些问题:• 面对海量数据,企业如何避免信息过载,实现有效分类?• 面对大量客户信......