《向量数据库指南》深度解析：GraphRAG如何精准应对不同类型的查询

时间：2024-10-26 17:52:46浏览次数：3

标签：文本 GraphRAG 用户 Community Entity 响应向量查询精准

查询

GraphRAG 有两种不同的查询工作流程，针对不同类型的查询进行了优化：

全局搜索：通过利用 Community 摘要，对涉及整个数据语料库的整体性问题进行推理。
本地搜索：通过扩展到特定 Entity 的邻居和相关概念，对特定 Entity 进行推理。

这个全局搜索工作流程包括以下几个阶段：

(图片来源：https://microsoft.github.io/graphrag/)

用户查询和对话历史：系统将用户查询和对话历史作为初始输入。
Community 报告分批：系统使用由 LLM 从 Community 层次结构的指定级别生成的节点 Community 报告作为上下文数据。这些 Community 报告被打乱并分成多个批次（打乱的 Community 报告批次 1、批次 2... 批次 N）。
RIR（评级中间响应）：每批 Community 报告进一步被划分为预定义大小的文本块。每个文本块用于生成一个中间响应。响应包含一个信息片段列表，称为点。每个点都有一个数值分数，表示其重要性。这些生成的中间响应是评级中间响应（评级中间响应 1、响应 2... 响应 N）。
排名和过滤：系统对这些中间响应进行排名和过滤，选择最重要的点。选定的重要点形成聚合的中间响应。
最终响应：聚合的中间响应被用作上下文以生成最终回复。

当用户提出关于特定 Entity（如人名、地点、组织等）的问题时，我们建议使用本地搜索工作流程。这个过程包括以下步骤：

(图片来源：https://microsoft.github.io/graphrag/)

用户查询：首先，系统接收用户查询，这可能是一个简单的问题或更复杂的查询。
搜索相似 Entity：系统从知识图中识别出与用户输入语义相关的一组 Entity。这些 Entity 作为进入知识图谱的入口点。这一步骤中使用像 Milvus 这样的向量数据库进行文本相似性搜索。
Entity-文本单元映射：提取的文本单元被映射到相应的 Entity，移除原始的文本信息。
Entity-关系提取：这一步提取关于 Entity 及其相应关系的特定信息。
Entity-协变量（Covariate）映射：这一步将 Entity 映射到它们的协变量，这可能包括统计数据或其他相关属性。
Entity- Community 报告映射：Community 报告被整合到搜索结果中，纳入一些全局信息。
利用对话历史：如果有对话历史，系统使用对话历史来更好地理解用户的意图和上下文。
生成响应：最后，系统根据前几步生成的经过过滤和排序的数据生成并响应用户查询。

标签：文本,GraphRAG,用户,Community,Entity,响应,向量,查询,精准
From： https://blog.csdn.net/qinglingye/article/details/143108391

python实战（三）——文本向量化/文本表示
一、概念文本向量化是自然语言处理领域的重要环节，也是现在大语言模型开发重要基础。计算机程序无法理解文字信息（实际上非数值类型的信息都无法理解），因此我们需要将文字信息转换成计算机程序可理解的数值类型。通俗来说就是我们的算法模型是一系列函数和公式的组合......
LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势
近年来,大型语言模型(LargeLanguageModels,LLMs)在自然语言处理领域取得了显著进展。受此启发,研究人员开始探索将LLMs应用于时间序列预测任务的可能性。由于时间序列数据与文本数据在特征上存在显著差异,直接将LLMs应用于时间序列预测仍面临诸多挑战。为了解决这一问题,Jin等......
FaceRate.ai：精准的面部评分与深度分析，为你的外貌带来全新视角
摘要：FaceRate.ai是一款面部分析工具，通过精准评分和黄金比例测试，帮助用户深入了解自己的面部特征。它不仅适合个人提升外貌认知，还为美容师、设计师、艺术家等提供创作灵感。FaceRate.ai：面部分析的智能伴侣全面的面部特征评分与分析在FaceRate.ai，你可以获得从眼睛、鼻子、嘴巴......
向量正交
过原点的两向量\(u\)与向量\(v\)垂直相当于点\(a\)到点\(b\)的距离与点\(a\)到点\(-b\)的距离相等，也即它们的距离的平方相等。计算点\(a\)到点\(-b\)的距离：\(\begin{align}[distance(a,-b)]^2&=\lVertu-(-v)\rVert^2=\lVertu+v\rVert^2\\&=(u+v)\cdot(u+v)\\&=u\cdot(u+......
向量
在数学中，向量（也称为矢量），是指具有大小和方向的量；书写向量时，水平书写的向量叫做行向量向量的大小就是向量的长度，也叫做模。向量的方向描述了空间中向量的指向；向量中的数表达了向量在每个维度上的有向位移。特殊向量零向量：大小为0，没有方向的向量，并且它不可以被归一化。单位向......
「深度解析」向量召回和字面召回用法和组合
上面图中的5个问题，是每个使用大模型进行知识库搭建的时候都要遇到问题，这些问题基本上就决定了问答答案的准确性，本篇文章我们先不讨论上面五个问题的解决方案，我们今天重点讨论两种召回方式：字面召回和向量召回，字面和向量召回都是搜索召回中的重要方法，如何更好地权......
精准查询车险记录,VIN解析查询服务
为什么要通过VIN查询车险记录？在购买二手车时，车险记录是一个非常重要的参考指标。它可以帮助您了解车辆是否发生过重大事故、是否有过频繁的维修记录，甚至可以推测出车辆的实际使用情况。通过VIN查询车险记录，您可以：精准了解车辆历史：通过车险记录，您可以清楚地知道车辆是否有......
京准电钟：NTP时间同步服务器助力精准计算机数据网络
京准电钟：NTP时间同步服务器助力精准计算机数据网络京准电钟：NTP时间同步服务器助力精准计算机数据网络京准电子科技官微——ahjzsz摘要:首先对计算机网络时间同步相关技术进行了介绍,然后阐述了时间同步技术在现代计算机网络中的应用与发展,最后指出时间同步网络在下一代网络(......
打造地下空间精准评价体系，服务城市地下合理开发
为贯彻党的二十大和二十届二中、三中全会精神，落实《中共中央办公厅国务院办公厅关于全面加强资源节约工作的意见》，统筹推进城市地下空间合理开发利用，充分挖掘地下空间资源潜力，提高土地要素配置的精准性和利用效率，使优势地区有更大发展空间，增强城市综合承载能力,促进经济社会高......
纷享销客CRM“标签管理”助力企业精准营销业绩增长
在数字化驱动的商业世界中，数据管理无疑是企业铸就成功的核心要素。它能够帮助企业精准洞察市场趋势，深度了解客户需求，进而优化业务流程，并在激烈的市场竞争中崭露头角。然而，在实际的业务场景中，还尚存这些问题：• 面对海量数据，企业如何避免信息过载，实现有效分类？• 面对大量客户信......

《向量数据库指南》深度解析：GraphRAG如何精准应对不同类型的查询

查询

相关文章

赞助商

阅读排行