RAG系统检索的文档可能并不总是与用户的查询保持一致,这是一个常见的现象。当文档可能缺乏查询的完整答案或者包含冗余信息或包含不相关的细节,或者文档的顺序可能与用户的意图不一致时,就会经常出现这种情况。
本文将探讨三种有效的技术来增强基于rag的应用程序中的文档检索,通过结合这些技术,可以检索与用户查询密切匹配的更相关的文档,从而生成更好的答案。
查询扩展
查询扩展指的是一组重新表述原始查询的技术。
本文将讨论两种易于实现的流行方法。
1、使用生成的答案扩展查询
给定一个输入查询,首先让LLM提供一个假设答案(不管其正确性),然后将查询和生成的答案组合在一个提示中并发送给检索系统。
这种技术效果非常的好。这篇论文有详细的介绍:https://arxiv.org/abs/2212.10496
这个方法的思想是,我们希望检索看起来更像答案的文档,我们感兴趣的是它的结构和表述。所以可以将假设的答案视为帮助识别嵌入空间中相关邻域的模板。
https://avoid.overfit.cn/post/2f2d747462c44425be906b7c5611fe37
标签:检索,RAG,https,技巧,查询,文档,答案 From: https://www.cnblogs.com/deephub/p/17976066