首页 > 其他分享 >RAG中的3个高级检索技巧

RAG中的3个高级检索技巧

时间:2024-01-20 09:56:09浏览次数:41  
标签:检索 RAG https 技巧 查询 文档 答案

RAG系统检索的文档可能并不总是与用户的查询保持一致,这是一个常见的现象。当文档可能缺乏查询的完整答案或者包含冗余信息或包含不相关的细节,或者文档的顺序可能与用户的意图不一致时,就会经常出现这种情况。

本文将探讨三种有效的技术来增强基于rag的应用程序中的文档检索,通过结合这些技术,可以检索与用户查询密切匹配的更相关的文档,从而生成更好的答案。

查询扩展

查询扩展指的是一组重新表述原始查询的技术。

本文将讨论两种易于实现的流行方法。

1、使用生成的答案扩展查询

给定一个输入查询,首先让LLM提供一个假设答案(不管其正确性),然后将查询和生成的答案组合在一个提示中并发送给检索系统。

这种技术效果非常的好。这篇论文有详细的介绍:https://arxiv.org/abs/2212.10496

这个方法的思想是,我们希望检索看起来更像答案的文档,我们感兴趣的是它的结构和表述。所以可以将假设的答案视为帮助识别嵌入空间中相关邻域的模板。

 

https://avoid.overfit.cn/post/2f2d747462c44425be906b7c5611fe37

标签:检索,RAG,https,技巧,查询,文档,答案
From: https://www.cnblogs.com/deephub/p/17976066

相关文章

  • 实战技巧CVE-2015-0005
    启用SMB签名和通信会话签名后,应用服务器和客户端之间的所有流量都有签名验证保护,中间人gongji者因为无法伪造签名而不能与目标主机进行正常的通信。签名密钥SessionKey基于客户端账号的口令NTLM值生成,应用服务器在认证阶段从认证服务器获取;客户端采用和认证服务器相同的算法,基于自......
  • dremio 基于Options注解的配置技巧
    以前简单写过一个dremio配置相关的介绍,以下是一个简单的使用原理dremio自己定义了一个Options的注解,包含此注解的类会被启动的时候进行类扫描加载,Options的会存储起来(分为不用类型的)有session级别的,系统级别的。。。。简单使用pom.xml <?xmlversion="1.......
  • 常用Unity的优化技巧集锦
    Unity性能优化是面试的时候经常被问道的一些内容,今天给大家分享一些常用的Unity的优化技巧和思路,方便大家遇到问题时候参考与学习。包体大小优化游戏的安装包体大小对于游戏开发而言非常重要,因为发布后这些包都会上传到渠道或商店让用户下载,包体越小用户下载的时间就越少,如果一......
  • 一文掌握Vue3函数式组件中的confirm实现技巧!
    在做后台项目时候,使用声明式组件比较多,就是写一个.vue文件,在里面写template、script、style哪里需要,就在哪里导入。而对于前台项目而言,我们期望可以直接通过方法的形式调用,利用函数式组件,在封装时除了要写.vue,还要多一个手动渲染和卸载的步骤。我们可以通过h函数可以生成一个vno......
  • Code Review、InLineChat、RAG能力全部独家提供,这波上新CodeGeeX平替Github Copilot稳
    智谱AI2024年度的技术开放日上,CodeGeeX重磅发布第三代模型。针对CodeGeeX插件产品的系列新功能,也同时上线发布,提供给用户免费使用。一、第三代模型性能全面提升CodeGeeX第三代模型正式发布,基础能力全面提升。针对Python、Java、JavaScript、C++、Golang五种主流编程语言,代......
  • uni.setStorageSync在登录页面设置缓存,第一次进入首页在onload里面获取不到缓存数据的
    在onLoad里面获取不到缓存:onLoad(option){consttoken=uni.getStorageSync('token');if(!token){uni.showToast({title:"请先登录",icon:"error",......
  • redis实战技巧
    1.分析key大小[root@db-51~]#redis-cli-h10.0.0.51-p6380--bigkeys#Scanningtheentirekeyspacetofindbiggestkeysaswellas#averagesizesperkeytype.Youcanuse-i0.1tosleep0.1sec#per100SCANcommands(notusuallyneeded).--------......
  • 【Azure Data Lake Storage】如何才能保留Blob中的文件目录结构(即使文件夹中文件数量
    问题描述在使用AzureStorageAccountBlob时候,发现当文件夹中的Blob(文件)被全部输出后,文件夹也会消失?为什么它不能像Windows系统中的文件夹一样,即使是一个空文件夹。也会一直保留呢? 问题解答这是因为 AzureStorageAccountBlob对Container下的文件管理采用的是扁平......
  • 基于langchain和文心一言的检索增强生成(RAG)初级实验
    一、什么是RAG?RAG的架构如图中所示,简单来讲,RAG就是通过检索获取相关的知识并将其融入Prompt,让大模型能够参考相应的知识从而给出合理回答。因此,可以将RAG的核心理解为“检索+生成”,前者主要是利用向量数据库的高效存储和检索能力,召回目标知识;后者则是利用大模型和Prompt工程,将召回......
  • MounRiver使用技巧及配置8
    关于MRS配置lst文件显示C代码MRS要进行如下配置:此外,要确保此处勾选正常,如下图: 关于MounRiver新建工程文件夹以及工程的命名MounRiver新建工程文件夹命名可以有空格,但工程的命名不能有空格,否则编译会报错,如下图: 关于MRS编译同时输出hex文件和bin文件按照下图添加即可:......