首页 > 其他分享 >HyDE 如何改进了传统的 RAG 方法?

HyDE 如何改进了传统的 RAG 方法?

时间:2024-11-26 09:11:21浏览次数:5  
标签:检索 RAG 嵌入 假想 改进 HyDE 答案 文档

HyDE的方法就是让AI先自己猜一个答案,然后用这个猜测去寻找相关的真实信息,最后结合起来,给出一个更准确、更有参考依据的回答。

一、什么是RAG?

RAG(Retrieval-Augmented Generation)是指"检索增强生成"。

这是一种让AI模型在回答问题时,不仅依赖自身的知识,还从一个数据库(比如文档库、知识库)中检索相关信息来辅助回答的方法。

二、传统RAG的方法存在什么问题?

传统的RAG在检索阶段可能会遇到这样的问题:

问题的表述和答案的表述可能并不相似。

举个例子:

  • 你的问题是:"什么是机器学习?"
  • 但是在数据库中,可能有一段话是:"机器学习是一种让计算机从数据中学习的方法。"

当我们用问题去匹配数据库时,因为问题和答案的表述方式不同,检索系统可能找不到最相关的内容,甚至可能找到一些不相关但表述相似的内容,比如:"什么是人工智能?"

三、HyDE是如何解决这个问题的?

HyDE(Hypothetical Document Embeddings,假设性文档嵌入)的方法是:

步骤1:生成一个假想的答案

首先,让AI模型根据你的问题,自己生成一个可能的答案。这个答案不一定完全正确,甚至可能有错误。

步骤2:将假想答案转换为向量

然后,将这个假想答案进行嵌入,即转换成向量形式。

步骤3:检索相关的真实内容

接下来,用这个假想答案的向量去查询数据库,寻找与之最相似的内容。

步骤4:生成最终答案

最后,将假想答案、检索到的真实内容和原始问题一起输入到AI模型中,生成一个更加准确的回答。

四、为什么HyDE的方法更有效?

更好的匹配:

假想答案的语言表述和真实答案更接近,所以在向量空间中,它更容易匹配到相关的内容。

过滤错误信息:

虽然假想答案可能有错误,但在嵌入和检索过程中,模型会过滤掉这些错误,关注于匹配真实的、有用的信息。

五、HyDE的优缺点

优点:

提高了检索到相关信息的概率,从而提高了最终答案的质量。

缺点:

需要额外的计算步骤(生成假想答案和嵌入),可能会增加响应时间和计算成本。

六、示例

HyDE方法通过生成一个包含关键信息的假想答案,改善检索过程,最终提供更准确和有用的回答。

例子1: HyDE方法如何提高检索和回答的效果

场景:

假设我们有一个大型的知识库,里面包含了大量关于历史事件的文档。其中有一段内容是:

"拿破仑·波拿巴是法国著名的军事领袖和皇帝,他在滑铁卢战役中被击败,标志着他统治的结束。"

用户的提问:

"哪个法国领导人在一场著名的战役中失败,结束了他的统治?"

传统RAG方法的问题:

  1. 检索过程: 传统的RAG方法会将用户的问题进行嵌入,得到一个向量表示,然后在向量数据库中寻找与之相似的文档。

  2. 潜在问题: 由于用户的问题没有直接提到"拿破仑"或"滑铁卢战役",而是用了描述性的语言,嵌入向量可能无法与包含这些关键词的文档高度匹配。

  3. 结果: 检索系统可能返回一些与法国领导人或战役有关但不直接相关的文档,无法提供准确的答案。

HyDE方法的应用:

步骤1:生成假想答案

我们使用一个大型语言模型(LLM)根据用户的问题生成一个假想的答案:

"可能是拿破仑在滑铁卢战役中失败,结束了他的统治。"

步骤2:嵌入假想答案

将这个假想答案进行嵌入,得到一个新的向量表示。

由于假想答案包含了"拿破仑"和"滑铁卢战役"等关键信息,嵌入向量会更接近相关文档的向量。

步骤3:检索相关文档

使用假想答案的嵌入向量在数据库中进行检索。

检索系统更容易找到包含相关信息的文档,例如之前提到的关于拿破仑的那段内容。

步骤4:生成最终答案

将原始问题、假想答案和检索到的相关文档一起输入到LLM中。

LLM综合这些信息,生成一个准确且详细的回答:

"拿破仑·波拿巴是你提到的法国领导人。
他在1815年的滑铁卢战役中被击败,这场失败结束了他的统治。"

为什么HyDE方法更有效?

  • 桥接语义差异: 假想答案使用了更直接、更明确的语言,包含了关键的实体和事件名称,使得嵌入向量更容易匹配到相关文档。

  • 提高检索准确性: 通过假想答案的嵌入,检索系统能够找到最相关的内容,而不是被问题表述方式的差异所影响。

  • 增强最终回答: LLM结合了用户的问题、假想答案和高相关性的文档,生成了一个全面且准确的回答。

对比传统方法:

传统RAG可能的回答:

"抱歉,我无法找到相关的信息。"

"可能是某个法国领导人在某次战役中失败了。"

使用HyDE方法的回答:

"拿破仑·波拿巴在滑铁卢战役中失败,这场失败结束了他的统治。"

它有效地解决了用户问题与文档内容在表述方式上的差异,提高了检索和回答的质量。

例子2: 当生成的假想答案有错误时

场景:

假设我们有一个大型的知识库,包含了大量关于科学发现和著名科学家的文档。

用户的提问:

"谁发现了相对论?"

步骤1:生成假想答案(可能错误)

使用大型语言模型(LLM)根据用户的问题生成一个假想的答案。

假想答案(错误的):

"尼古拉·特斯拉发现了相对论。"

这个答案是错误的,因为实际上是阿尔伯特·爱因斯坦提出了相对论。

步骤2:嵌入假想答案

将错误的假想答案进行嵌入,得到一个向量表示。

虽然答案错误,但其中包含了关键的实体名称:"尼古拉·特斯拉"和"相对论"。

步骤3:检索相关文档

使用假想答案的嵌入向量在数据库中进行检索。

检索系统会寻找与"尼古拉·特斯拉"和"相对论"相关的文档。

可能的检索结果:

  • 关于尼古拉·特斯拉的生平和贡献的文档。

  • 关于阿尔伯特·爱因斯坦和相对论的文档。

  • 讨论特斯拉与爱因斯坦之间关系的文档。

步骤4:生成最终答案

将原始问题、假想答案和检索到的相关文档一起输入到LLM中。

LLM综合这些信息,注意到假想答案中的矛盾和检索到的正确信息,生成一个准确的回答。

最终答案:

"阿尔伯特·爱因斯坦发现了相对论,而尼古拉·特斯拉以他的电气工程和发明闻名。"

解析

  • 纠正错误信息: 虽然假想答案错误地将相对论归功于特斯拉,但检索系统找到了关于爱因斯坦和相对论的文档。
  • LLM的角色: LLM在综合信息时,能够识别出假想答案与检索到的文档之间的矛盾,进而纠正错误。
  • 提供准确答案: 最终,模型提供了正确的答案,并且可能还会补充一些相关信息以澄清误解。

第一步生成错误时,为什么HyDE方法仍然有效?

  • 丰富的上下文信息: 即使假想答案有错误,它仍然提供了丰富的上下文(例如,涉及的主题和人物),有助于检索相关文档。

  • 矛盾的识别和纠正: LLM在处理输入时,会尝试协调假想答案和检索到的文档。如果发现矛盾,模型倾向于依据更可靠的检索内容。

  • 避免错误传播: 假想答案的错误不会直接传播到最终答案中,因为检索和综合过程起到了校正的作用。

3、再举一个当生成的假想答案有错误例子

用户的提问:

"月球是由什么组成的?"

假想答案(可能错误):

"月球主要由奶酪组成。"(这是一个常见的童话或玩笑)

检索过程:

检索到的真实文档会描述月球的实际组成,如岩石、玄武岩等。

最终答案:

"月球主要由岩石和金属组成,表面覆盖着玄武岩和其他岩石类型。
'月亮是奶酪做的'是一个童话故事,并不是真实的。"

总结

HyDE的方法就是让AI先自己猜一个答案,然后用这个猜测去寻找相关的真实信息,最后结合起来,给出一个更准确、更有参考依据的回答。

  • HyDE方法具有容错性,即使假想答案有错误,整个流程仍然能够通过检索和信息综合来校正这些错误。

  • 关键在于检索到的真实信息,它为模型提供了正确的依据。

  • LLM在生成最终答案时,会倾向于使用检索到的可信信息来纠正假想答案中的错误。

标签:检索,RAG,嵌入,假想,改进,HyDE,答案,文档
From: https://www.cnblogs.com/ghj1976/p/18569319/hyde-ru-he-gai-jin-le-chuan-tong-de-rag-fang-fa

相关文章

  • AttributeError: module ‘backend_interagg‘ has no attribute ‘FigureCanvas‘.
    plt.figure(figsize=(12,6))File"D:\anaconda\Lib\site-packages\matplotlib\pyplot.py",line1027,infiguremanager=new_figure_manager(^^^^^^^^^^^^^^^^^^^File"D:\anaconda\Lib\site-packages\matplotlib\pyplot.py",line549......
  • RT-DETR融合[CVPRW2024]MAN中的MLKA模块及相关改进思路
    RT-DETR使用教程: RT-DETR使用教程RT-DETR改进汇总贴:RT-DETR更新汇总贴《Multi-scaleAttentionNetworkforSingleImageSuper-Resolution》一、模块介绍    论文链接:https://arxiv.org/pdf/2209.14145v2    代码链接:https://github.com/icand......
  • CS61B 二叉搜索树的改进:B 树 笔记
    CS61B二叉搜索树的改进:B树笔记笔记的来源:CS61B-2024春季的课程课程主要内容:数据结构与算法分析课程运用语言:Java你可以在我的笔记网站里获得更多有用的资源。这个课有6个Homework,10个Lab,9个Project。其中第一个project是一个完整的2024游戏的实现,很......
  • 部署local-path-storage
    环境:os:Centos7k8s:1个master2个nodes以下操作都是在master节点上完成1.下载配置文件cd/softwgethttps://raw.githubusercontent.com/rancher/local-path-provisioner/v0.0.30/deploy/local-path-storage.yaml 2.修改镜像文件local-path-storage.yaml因为无法访问国外的......
  • Yolo11改进策略:Block改进|VOLO,视觉识别中的视觉展望器|即插即用|附代码+改进方法
    摘要论文介绍VOLO模型概述:本文提出了一种名为VOLO的视觉识别模型,该模型旨在通过创新的注意力机制——前景器(Outlooker)来提高视觉识别的性能。VOLO模型在ImageNet等基准测试上取得了优异的结果。研究背景:传统的视觉Transformer(ViT)模型在全局依赖性建模上表现出色,但在将精......
  • 请描述一下cookies、sessionStorage和localStorage的区别?
    在前端开发中,cookies、sessionStorage和localStorage都是用于在浏览器中存储数据的机制,但它们之间存在显著的区别:1.数据的生命周期:Cookies:Cookie的生命周期可以通过expires或max-age属性设置。如果没有设置过期时间,Cookie会在浏览器会话结束时(关闭浏览器)被删除,这......
  • RAG应用
    为了使计算机能够理解和处理非结构化数据(如文本,图片,视频),通常使用嵌入模型(Embedding)将非结构化数据编码为向量[6]。可以理解为,向量就是非结构化数据的压缩。因此,在对非结构化数据进行相似性搜索、最近邻搜索(NNS,NearestNeighborSearch)时,可以使用向量的近似度来表征非结构化......
  • RAG应用评估
    为什么需要对RAG系统评估评估是AI开发流程中的一个非常关键步骤,它被用于检查当前策略相对于其他策略的有效性,或在当你对流程进行更改时进行评估。因此在进行LLM项目的开发和改进时,必须要有衡量其表现的方法。LlamaIndex中RAG处理过程(图片来源:https://docs.llamaindex.ai/en/stab......
  • RAG场景、数据、应用难点与解决
    RAG基础RAG也在很多行业积极实践中,在【RAG行业交流中发现的一些问题和改进方法】提到了,RAG应该算是核心底层,适配各行各业,依然需要基础组件和各行业的适配应用:如果我们需要倾向于获取外部知识和重视透明度,RAG是我们的首选。另一方面,如果我们正在使用稳定的标记数据,并旨在使模型......
  • AI领域中的RAG:软件测试人员的必备指南
    RAG在软件测试中的角色在传统的软件测试中,测试人员通常会关注功能正确性、性能、安全性和用户体验。然而,当涉及到AI系统时,测试的维度变得更加复杂。RAG提供了一种结构化的方法来评估AI模型的预测能力,尤其是在处理未知数据时的表现。RAG与软件测试人员软件测试人员需要熟悉RAG,因......