首页 > 数据库 >《向量数据库指南》——基础 RAG 与 GraphRAG 输出质量对比

《向量数据库指南》——基础 RAG 与 GraphRAG 输出质量对比

时间:2024-10-27 18:17:57浏览次数:3  
标签:RAG GraphRAG 基础 答案 数据 向量

基础 RAG 与 GraphRAG 输出质量对比

为了展示 GraphRAG 的有效性,其开发者在博客(https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/)中比较了基础 RAG 和 GraphRAG 的输出质量。我在这里引用一个简单的例子来说明。

使用的数据集

GraphRAG 的开发者在他们的实验中使用了来自新闻文章的暴力事件信息(Violent Incident Information from News Articles,VIINA)数据集。

注意:此数据集包含敏感内容。选择它仅是因为它复杂,包含不同的观点和信息。这个数据集能够真实反应复杂的实际情况,且数据足够新,没有被包含在 LLM 基础模型的训练中。

实验概览

基础 RAG 和 GraphRAG 都被问到了同样的问题,这需要汇总整个数据集中的信息来构成答案。

问:What are the top 5 themes in the dataset?

下图为答案。基础 RAG 提供的结果与战争主题无关,因为向量搜索检索到了无关的文本,导致了答案的不准确。相比之下,GraphRAG 提供了一个清晰且高度相关的答案,识别了主要的主题和相关细节。结果与数据集一致,并引用了源材料。

上述例子展示了 GraphRAG 如何通过结合知识图谱和向量数据库,更有效地处理需要跨数据集整合信息的复杂查询,从而提高答案的相关性和准确性。

在论文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》中进行的进一步实验表明,GraphRAG 在多跳推理和复杂信息总结方面性能明显更佳。研究表明,GraphRAG 在全面性和多样性方面都超过了基础 RAG:

  • 全面性:答案覆盖问题的所有方面。

  • 多样性:答案提供的观点和见解具有多样性和丰富性。

我们建议您阅读 GraphRAG 论文,以获取更多实验详情(https://arxiv.org/pdf/2404.16130)

标签:RAG,GraphRAG,基础,答案,数据,向量
From: https://blog.csdn.net/qinglingye/article/details/143108459

相关文章

  • 如何训练 RAG 模型
    训练RAG(Retrieval-AugmentedGeneration)模型涉及多个步骤,包括准备数据、构建知识库、配置检索器和生成模型,以及进行训练。以下是一个详细的步骤指南,帮助你训练RAG模型。1.安装必要的库确保你已经安装了必要的库,包括HuggingFace的transformers和datasets,以及Ela......
  • 高级RAG技术:提升生成式AI系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化
    高级RAG技术:提升生成式AI系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】检索增强生成(RAG)是一种强大的技术,它将信息检索与生成式AI相结合,以产生更准确、上下文更丰富的响应。本文将探讨15种高级RAG技术,以提高生成式AI系统的输出质量和整体性能的......
  • 《向量数据库指南》深度解析:GraphRAG如何精准应对不同类型的查询
    查询GraphRAG有两种不同的查询工作流程,针对不同类型的查询进行了优化:全局搜索:通过利用Community摘要,对涉及整个数据语料库的整体性问题进行推理。本地搜索:通过扩展到特定Entity的邻居和相关概念,对特定Entity进行推理。这个全局搜索工作流程包括以下几个阶段:(......
  • python实战(三)——文本向量化/文本表示
    一、概念    文本向量化是自然语言处理领域的重要环节,也是现在大语言模型开发重要基础。计算机程序无法理解文字信息(实际上非数值类型的信息都无法理解),因此我们需要将文字信息转换成计算机程序可理解的数值类型。通俗来说就是我们的算法模型是一系列函数和公式的组合......
  • LongRAG: 突破长文本理解的新范式
    在人工智能飞速发展的今天,大型语言模型(LLM)已经在多个领域展现出惊人的能力。然而,在处理长文本问答任务时,它们仍然面临着不少挑战。最近,来自中国科学院、清华大学等机构的研究团队提出了一个创新性的解决方案-LongRAG系统。这个系统巧妙地解决了现有技术的局限性,为......
  • HarryPotter: Aragog (1.0.2)靶场渗透
    靶场:HarryPotter:Aragog(1.0.2)HarryPotter:Aragog(1.0.2)~VulnHubhttps://www.vulnhub.com/entry/harrypotter-aragog-102,688/攻击机:kali-linux-2024第一部分:信息收集1,将两台虚拟机网络连接都改为NAT模式,并查看靶机的MAC地址2,攻击机上做主机扫描发现靶机......
  • RAG(Retrieval-Augmented Generation)技术
    RAG(Retrieval-AugmentedGeneration)技术是一种结合检索与生成能力的知识增强方案,专门用于应对复杂多变的信息查询和生成挑战。其核心在于结合先进的向量数据库与大模型的智能问答能力,使得AI系统能够更准确地理解和回应用户的需求。而混合检索作为RAG技术中的关键组成部分,结......
  • RAG技术
    RAG(Retrieval-AugmentedGeneration)技术是一种结合检索与生成能力的知识增强方案,专门用于应对复杂多变的信息查询和生成挑战。其核心在于结合先进的向量数据库与大模型的智能问答能力,使得AI系统能够更准确地理解和回应用户的需求。而混合检索作为RAG技术中的关键组成部分,结......
  • 搭建个人AI知识库:RAG与本地模型实践指南
    引言你是否想过拥有一个私人订制的AI助手,能够随时为你提供最个性化的信息?本文将带你一步步搭建一个基于本地模型和RAG技术的个人知识库。搭建本地模型环境os:archlinux内存:32gcpu:6核12线程python:3.12.7docker27.3.1+docker-compose向量库:milvus2.4.13+attu......
  • 在笔记本电脑上,实现本地知识库和大模型检索增强生成(RAG)
    现在,我们可以引入AnythingLLM,管理本地知识库,并和Ollama结合起来,实现大模型+知识库+RAG的智能问答。1.下载AnythingLLMAnythingLLM是采用MIT许可证的开源框架,支持快速在本地部署基于检索增强生成(RAG)的大模型应用。在不调用外部接口、不发送本地数据的情况下,确保用户数据......