《向量数据库指南》——基础 RAG 与 GraphRAG 输出质量对比

时间：2024-10-27 18:17:57浏览次数：8

基础 RAG 与 GraphRAG 输出质量对比

为了展示 GraphRAG 的有效性，其开发者在博客(https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/)中比较了基础 RAG 和 GraphRAG 的输出质量。我在这里引用一个简单的例子来说明。

使用的数据集

GraphRAG 的开发者在他们的实验中使用了来自新闻文章的暴力事件信息（Violent Incident Information from News Articles，VIINA）数据集。

注意：此数据集包含敏感内容。选择它仅是因为它复杂，包含不同的观点和信息。这个数据集能够真实反应复杂的实际情况，且数据足够新，没有被包含在 LLM 基础模型的训练中。

实验概览

基础 RAG 和 GraphRAG 都被问到了同样的问题，这需要汇总整个数据集中的信息来构成答案。

问：What are the top 5 themes in the dataset?

下图为答案。基础 RAG 提供的结果与战争主题无关，因为向量搜索检索到了无关的文本，导致了答案的不准确。相比之下，GraphRAG 提供了一个清晰且高度相关的答案，识别了主要的主题和相关细节。结果与数据集一致，并引用了源材料。

上述例子展示了 GraphRAG 如何通过结合知识图谱和向量数据库，更有效地处理需要跨数据集整合信息的复杂查询，从而提高答案的相关性和准确性。

在论文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》中进行的进一步实验表明，GraphRAG 在多跳推理和复杂信息总结方面性能明显更佳。研究表明，GraphRAG 在全面性和多样性方面都超过了基础 RAG：

全面性：答案覆盖问题的所有方面。
多样性：答案提供的观点和见解具有多样性和丰富性。

我们建议您阅读 GraphRAG 论文，以获取更多实验详情(https://arxiv.org/pdf/2404.16130)。

标签：RAG,GraphRAG,基础,答案,数据,向量
From： https://blog.csdn.net/qinglingye/article/details/143108459

如何训练 RAG 模型
训练RAG（Retrieval-AugmentedGeneration）模型涉及多个步骤，包括准备数据、构建知识库、配置检索器和生成模型，以及进行训练。以下是一个详细的步骤指南，帮助你训练RAG模型。1.安装必要的库确保你已经安装了必要的库，包括HuggingFace的transformers和datasets，以及Ela......
高级RAG技术：提升生成式AI系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化
高级RAG技术：提升生成式AI系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】检索增强生成（RAG）是一种强大的技术，它将信息检索与生成式AI相结合，以产生更准确、上下文更丰富的响应。本文将探讨15种高级RAG技术，以提高生成式AI系统的输出质量和整体性能的......
《向量数据库指南》深度解析：GraphRAG如何精准应对不同类型的查询
查询GraphRAG有两种不同的查询工作流程，针对不同类型的查询进行了优化：全局搜索：通过利用Community摘要，对涉及整个数据语料库的整体性问题进行推理。本地搜索：通过扩展到特定Entity的邻居和相关概念，对特定Entity进行推理。这个全局搜索工作流程包括以下几个阶段：(......
python实战（三）——文本向量化/文本表示
一、概念文本向量化是自然语言处理领域的重要环节，也是现在大语言模型开发重要基础。计算机程序无法理解文字信息（实际上非数值类型的信息都无法理解），因此我们需要将文字信息转换成计算机程序可理解的数值类型。通俗来说就是我们的算法模型是一系列函数和公式的组合......
LongRAG: 突破长文本理解的新范式
在人工智能飞速发展的今天,大型语言模型(LLM)已经在多个领域展现出惊人的能力。然而,在处理长文本问答任务时,它们仍然面临着不少挑战。最近,来自中国科学院、清华大学等机构的研究团队提出了一个创新性的解决方案-LongRAG系统。这个系统巧妙地解决了现有技术的局限性,为......
HarryPotter: Aragog (1.0.2)靶场渗透
靶场：HarryPotter:Aragog(1.0.2)HarryPotter:Aragog(1.0.2)~VulnHubhttps://www.vulnhub.com/entry/harrypotter-aragog-102,688/攻击机：kali-linux-2024第一部分：信息收集1,将两台虚拟机网络连接都改为NAT模式，并查看靶机的MAC地址2，攻击机上做主机扫描发现靶机......
RAG（Retrieval-Augmented Generation）技术
RAG（Retrieval-AugmentedGeneration）技术是一种结合检索与生成能力的知识增强方案，专门用于应对复杂多变的信息查询和生成挑战。其核心在于结合先进的向量数据库与大模型的智能问答能力，使得AI系统能够更准确地理解和回应用户的需求。而混合检索作为RAG技术中的关键组成部分，结......
RAG技术
RAG（Retrieval-AugmentedGeneration）技术是一种结合检索与生成能力的知识增强方案，专门用于应对复杂多变的信息查询和生成挑战。其核心在于结合先进的向量数据库与大模型的智能问答能力，使得AI系统能够更准确地理解和回应用户的需求。而混合检索作为RAG技术中的关键组成部分，结......
搭建个人AI知识库：RAG与本地模型实践指南
引言你是否想过拥有一个私人订制的AI助手，能够随时为你提供最个性化的信息？本文将带你一步步搭建一个基于本地模型和RAG技术的个人知识库。搭建本地模型环境os:archlinux内存:32gcpu:6核12线程python:3.12.7docker27.3.1+docker-compose向量库:milvus2.4.13+attu......
在笔记本电脑上，实现本地知识库和大模型检索增强生成（RAG）
现在，我们可以引入AnythingLLM，管理本地知识库，并和Ollama结合起来，实现大模型+知识库+RAG的智能问答。1.下载AnythingLLMAnythingLLM是采用MIT许可证的开源框架，支持快速在本地部署基于检索增强生成（RAG）的大模型应用。在不调用外部接口、不发送本地数据的情况下，确保用户数据......

《向量数据库指南》——基础 RAG 与 GraphRAG 输出质量对比

基础 RAG 与 GraphRAG 输出质量对比

使用的数据集

实验概览

相关文章

赞助商

阅读排行