RAG 中为什么使用 ReRank 而不是 Embedding 直接一步到位？

时间：2024-10-17 16:50:49浏览次数：15

标签：检索 RAG 相似 Rerank ReRank 文档 Embedding 向量

Embedding 检索时会获得问题与文本之间的相似分，以往的 RAG 服务直接基于相似分进行排序，但是事实上向量检索的相似分是不够准确的。

原因是 Embedding 过程是将文档的所有可能含义压缩到一个向量中，方便使用向量进行检索。但是文本压缩为向量必然会损失信息，从而导致最终 Embedding 检索的相似分不够准确。
在这里插入图片描述
可以看到 Embedding 过程包含两步：

运行单个 Transformer 计算以创建查询向量。
将查询向量与具有余弦相似性的文档向量进行比较，获取相似文档。

而 Rerank 阶段不会向量化，而是将查询与匹配的单个文档 1 对 1 的计算相似分，没有向量化带来的信息损失，必然会得到更好的效果，对应的过程如下所示：
在这里插入图片描述
那直接执行 Rerank 是否可行呢？肯定也是不行的，Rerank 需要 1 对 1 计算相似分的，在海量的文档中一一比对查找文档，效率肯定是不能接受的。

除了这个原因以外，拆分 Rerank 阶段也提供了更加灵活的筛选文档的能力，比如 Ragflow 就是在 Rerank 中使用 0.3 * 文本匹配得分 + 0.7 * 向量匹配得分加权得出综合得分进行排序，Rerank 阶段可以提供类似这种灵活的选择手段。

标签：检索,RAG,相似,Rerank,ReRank,文档,Embedding,向量
From： https://blog.csdn.net/u014297502/article/details/143000495

清华最新RAG框架：Adaptive-Note RAG，比Adaptive RAG还要好
1.为什么要提出Adaptive-NoteRAG？RAG（检索增强生成）技术是一种能有效解决LLM（大语言模型）幻觉问题的可靠手段，通过借助外部非参数化知识，帮助LLMs拓展其知识边界。但是，传统RAG在长问答、多跳问答等复杂任务时，往往很难收集到足够信息。•多跳问答中，要回答“Whatdoestheacron......
【AI大模型】从 RAG 1.0到RAG 2.0，这次做对了什么？
RAG是目前最流行的补充生成式人工智能模型的方式，最近RAG的开创者提出了新的上下文语言模型(CLM)，他们称之为“RAG2.0”。今天让我们一块来从RAG目前的原理和缺点出发，看看他们所提出的RAG2.0是否能够为行业带来新的希望。LLM的时间有效性您应该知道，所有独立的大型......
使用博查Web Search API获取搜索引擎的网页链接和文本摘要，给AI/RAG应用增加联网搜索功
为什么需要WebSearchAPI？各类AINative应用、RAG应用、AIAgent智能体在开发过程都会遇到联网获取互联网网页信息的需求，此时需要得到原始网页链接以及文本摘要，以用于给pipeline中的大模型作为上下文总结使用。但目前仅国外的搜索引擎例如Bing、Google提供此类WebSearch......
DFT ATPG中常见影响coverage的因素有哪些？
#DFTATPG中常见影响Coverage的因素##一、电路结构复杂性1.**逻辑层次深度** -**原理** -当电路的逻辑层次很深时，信号在传播过程中会经过多个逻辑门的处理。这使得测试向量难以准确地控制和观察内部节点的状态。例如，在一个具有多层嵌套逻辑的电路中，如一个......
自然语言处理:第五十二章 LongCite：助力RAG应用，让大模型精准找到引用
代码：https://github.com/THUDM/LongCite\数据：HF：https://huggingface.co/datasets/THUDM/LongCite-45k魔搭：https://modelscope.cn/datasets/AI-ModelScope/LongCite-45k模型：HF：https://huggingface.co/THUDM魔搭：https://modelscope.cn/organization/ZhipuAIDemo：https:/......
用孩子能懂的语言，解释大语言模型中的 Embedding 和 Attention
为了让孩子能够理解大语言模型的embedding和attention技术，我们可以用一些生活中的简单例子来类比。1.Embedding：就像给每个单词做名片假设你在学校里认识很多小朋友，每个人都有不同的名字、喜欢的颜色和爱好。为了记住他们，老师给每个小朋友做了一张名片，上面写着这些信息。虽然每......
微软：LLM在RAG高效使用外部数据综述
......

RAG 中为什么使用 ReRank 而不是 Embedding 直接一步到位？

相关文章

赞助商

阅读排行