首页 > 其他分享 >RAG 中为什么使用 ReRank 而不是 Embedding 直接一步到位?

RAG 中为什么使用 ReRank 而不是 Embedding 直接一步到位?

时间:2024-10-17 16:50:49浏览次数:3  
标签:检索 RAG 相似 Rerank ReRank 文档 Embedding 向量

Embedding 检索时会获得问题与文本之间的相似分,以往的 RAG 服务直接基于相似分进行排序,但是事实上向量检索的相似分是不够准确的。

原因是 Embedding 过程是将文档的所有可能含义压缩到一个向量中,方便使用向量进行检索。但是文本压缩为向量必然会损失信息,从而导致最终 Embedding 检索的相似分不够准确。
在这里插入图片描述
可以看到 Embedding 过程包含两步:

  1. 运行单个 Transformer 计算以创建查询向量。
  2. 将查询向量与具有余弦相似性的文档向量进行比较,获取相似文档。

而 Rerank 阶段不会向量化,而是将查询与匹配的单个文档 1 对 1 的计算相似分,没有向量化带来的信息损失,必然会得到更好的效果,对应的过程如下所示:
在这里插入图片描述
那直接执行 Rerank 是否可行呢?肯定也是不行的,Rerank 需要 1 对 1 计算相似分的,在海量的文档中一一比对查找文档,效率肯定是不能接受的。

除了这个原因以外,拆分 Rerank 阶段也提供了更加灵活的筛选文档的能力,比如 Ragflow 就是在 Rerank 中使用 0.3 * 文本匹配得分 + 0.7 * 向量匹配得分 加权得出综合得分进行排序,Rerank 阶段可以提供类似这种灵活的选择手段。

标签:检索,RAG,相似,Rerank,ReRank,文档,Embedding,向量
From: https://blog.csdn.net/u014297502/article/details/143000495

相关文章

  • Python代码覆盖率工具之Coverage
    Python代码覆盖率工具之Coverage在软件开发过程中,确保代码覆盖率是质量控制的关键一环。通过测量代码覆盖率,开发者可以了解哪些部分的代码正在被测试执行,哪些部分尚未被覆盖,从而优化测试策略,提高代码质量。在Python中,Coverage是一个非常流行且功能强大的代码覆盖率工具。本文将详......
  • 清华最新RAG框架:Adaptive-Note RAG,比Adaptive RAG还要好
    1.为什么要提出Adaptive-NoteRAG?RAG(检索增强生成)技术是一种能有效解决LLM(大语言模型)幻觉问题的可靠手段,通过借助外部非参数化知识,帮助LLMs拓展其知识边界。但是,传统RAG在长问答、多跳问答等复杂任务时,往往很难收集到足够信息。•多跳问答中,要回答“Whatdoestheacron......
  • 【AI大模型】从 RAG 1.0到RAG 2.0,这次做对了什么?
    RAG是目前最流行的补充生成式人工智能模型的方式,最近RAG的开创者提出了新的上下文语言模型(CLM),他们称之为“RAG2.0”。今天让我们一块来从RAG目前的原理和缺点出发,看看他们所提出的RAG2.0是否能够为行业带来新的希望。LLM的时间有效性您应该知道,所有独立的大型......
  • 使用博查Web Search API获取搜索引擎的网页链接和文本摘要,给AI/RAG应用增加联网搜索功
    为什么需要WebSearchAPI?各类AINative应用、RAG应用、AIAgent智能体在开发过程都会遇到联网获取互联网网页信息的需求,此时需要得到原始网页链接以及文本摘要,以用于给pipeline中的大模型作为上下文总结使用。但目前仅国外的搜索引擎例如Bing、Google提供此类WebSearch......
  • DFT ATPG中常见影响coverage的因素有哪些?
    #DFTATPG中常见影响Coverage的因素##一、电路结构复杂性1.**逻辑层次深度**  -**原理**   -当电路的逻辑层次很深时,信号在传播过程中会经过多个逻辑门的处理。这使得测试向量难以准确地控制和观察内部节点的状态。例如,在一个具有多层嵌套逻辑的电路中,如一个......
  • 提升质量:利用Coverage分析Python Web项目的测试覆盖
    提升质量:利用Coverage分析PythonWeb项目的测试覆盖鉴于不同框架的运行机制各有差异,当利用Coverage工具对PythonWeb项目的测试覆盖率进行分析时,必须采取针对性的方法来确保获取精确的测试覆盖率数据。以下是我针对Django框架与Flask框架在使用Coverage方面的详尽总结。Django框......
  • Azure Storage (31) Azure File审核下载日志
    《WindowsAzurePlatform系列文章目录》 一.需求:1.有1个AzureCLI的命令,叫azstoragefiledownload--path--share-name[--account-key][--account-name]具体可以参考:https://learn.microsoft.com/en-us/cli/azure/storage/file?view=azure-cli-lat......
  • 自然语言处理:第五十二章 LongCite:助力RAG应用,让大模型精准找到引用
    代码:https://github.com/THUDM/LongCite\数据:HF:https://huggingface.co/datasets/THUDM/LongCite-45k魔搭:https://modelscope.cn/datasets/AI-ModelScope/LongCite-45k模型:HF:https://huggingface.co/THUDM魔搭:https://modelscope.cn/organization/ZhipuAIDemo:https:/......
  • 用孩子能懂的语言,解释大语言模型中的 Embedding 和 Attention
    为了让孩子能够理解大语言模型的embedding和attention技术,我们可以用一些生活中的简单例子来类比。1.Embedding:就像给每个单词做名片假设你在学校里认识很多小朋友,每个人都有不同的名字、喜欢的颜色和爱好。为了记住他们,老师给每个小朋友做了一张名片,上面写着这些信息。虽然每......
  • 微软:LLM在RAG高效使用外部数据综述
    ......