首页 > 其他分享 >检索增强生成 (RAG) 高级技巧大全

检索增强生成 (RAG) 高级技巧大全

时间:2024-12-20 15:30:53浏览次数:6  
标签:检索 RAG AI 模型 Athina LangChain 大全

本仓库汇集了各种检索增强生成 (RAG) 系统的高级技巧。RAG 是一种流行的方法,它通过从可靠来源查找正确的信息并将其转化为有用的答案来提高准确性和相关性。本仓库涵盖了最有效的 RAG 高级技巧,并提供了清晰的实现和解释。

前排提示,文末有大模型AGI-CSDN独家资料包哦!

本仓库的主要目标是为希望在其项目中使用 RAG 高级技术的研发人员提供有用的资源。从零开始构建这些技术需要时间,找到合适的评估方法也可能具有挑战性。本仓库通过提供现成的实现和评估指南简化了这一过程。

注意: 本仓库从基础的 RAG 开始,逐步介绍高级技术。每个 RAG 技术都包含研究论文/参考文献,供您进一步阅读。

大型语言模型 (LLM) 在固定的数据集上进行训练,这限制了它们处理私有或最新信息的能力。它们有时会“幻觉”,提供不正确但看似可信的答案。微调可以有所帮助,但它成本高昂,并且不适合反复对新数据进行再训练。检索增强生成 (RAG) 框架通过使用外部文档来改进 LLM 的响应,从而解决了这个问题,它利用上下文学习来实现。RAG 确保 LLM 提供的信息不仅在上下文中相关,而且准确且最新。

RAG 主要包含四个组件:

索引: 首先,将文档(任何格式)分割成块,并为这些块创建嵌入。然后将这些嵌入添加到向量存储中。•检索: 然后,检索器使用向量存储中的向量相似性等技术,根据用户的查询查找最相关的文档。•增强: 之后,“增强”部分将用户的查询与检索到的上下文组合成提示,确保 LLM 拥有生成准确响应所需的信息。•生成: 最后,将组合的查询和提示传递给模型,然后模型生成对用户查询的最终响应。

这些 RAG 组件允许模型访问最新、准确的信息,并根据外部知识生成响应。但是,为了确保 RAG 系统有效运行,必须评估其性能。

评估 RAG 应用对于了解这些系统的工作效率至关重要。通过检查其准确性和相关性,我们可以了解它们如何有效地将信息检索与生成模型相结合。这种评估有助于改进 RAG 应用在文本摘要、聊天机器人和问答等任务中的性能。它还可以找出改进的领域,确保这些系统在信息发生变化时提供可信的响应。总的来说,有效的评估有助于优化性能,并增强对 RAG 应用在实际应用中的信心。这些笔记本包含 Athina AI 中的端到端 RAG 实现 + RAG 评估部分。

以下是本仓库中涵盖的所有 RAG 技术的详细信息:

|
技术

|

工具

|

描述

|
| — | — | — |
|

简单 RAG (Naive RAG)

|

LangChain、Pinecone、Athina AI

|

将检索到的数据与 LLM 结合,以获得简单有效的响应。

|
|

混合 RAG (Hybrid RAG)

|

LangChain、Chromadb、Athina AI

|

结合向量搜索和 BM25 等传统方法,以获得更好的信息检索。

|
|

假设 RAG (Hyde RAG)

|

LangChain、Weaviate、Athina AI

|

创建假设文档嵌入,以查找与查询相关的资料。

|
|

父文档检索器 (Parent Document Retriever)

|

LangChain、Chromadb、Athina AI

|

将大型文档分解成小部分,如果一部分与查询匹配,则检索完整文档。

|
|

RAG 融合 (RAG fusion)

|

LangChain、LangSmith、Qdrant、Athina AI

|

生成子查询,使用倒排秩融合对文档进行排序,并使用最佳结果生成准确的响应。

|
|

上下文 RAG (Contextual RAG)

|

LangChain、Chromadb、Athina AI

|

压缩检索到的文档,只保留相关细节,以获得简洁准确的响应。

|
|

重写-检索-阅读 (Rewrite Retrieve Read)

|

LangChain、Chromadb、Athina AI

|

改进查询,检索更好的数据,并生成准确的答案。

|
|

校正 RAG (Corrective RAG)

|

LangChain、LangGraph、Chromadb、Athina AI

|

细化相关文档,删除不相关文档或进行网络搜索。

|
|

自我 RAG (Self RAG)

|

LangChain、LangGraph、FAISS、Athina AI

|

反思检索到的数据,以确保准确和完整的响应。

|
|

自适应 RAG (Adaptive RAG)

|

LangChain、LangGraph、FAISS、Athina AI

|

根据查询类型调整检索方法,使用索引数据或网络搜索。

|

每个笔记本的工作演示:demo.mp4

首先,使用以下命令克隆此仓库:

git clone https://github.com/athina-ai/rag-cookbooks.git

接下来,导航到项目目录:

进入“rag-cookbooks”目录后,按照每种技术的详细实现步骤操作。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

标签:检索,RAG,AI,模型,Athina,LangChain,大全
From: https://blog.csdn.net/2301_82275412/article/details/144611231

相关文章

  • SOLIDWORKS快捷键命令大全
    SOLIDWORKS是一款广泛应用于工程设计、产品开发及机械制造领域的三维计算机辅助设计(CAD)软件。它以其直观的用户界面、强大的设计功能,成为了深受专业设计师喜爱的设计工具。想要在SOLIDWORKS中以更高的效率绘图,掌握一些快捷键,会让你的设计工作更加得心应手!我们一起来看下SOLIDWORK......
  • 深入浅出:一个 RAG问答机器人调优示例
    一、RAG基本流程为了让大模型能回答关于公司规章制度的问题,我们需要构建一个RAG应用,RAG应用的工作流程包括:前排提示,文末有大模型AGI-CSDN独家资料包哦!解析:加载公司规章制度文档(如pdf、docx等),并解析为文本形式;分段:对解析后的文档进行分段,因为大模型的输入长度是有限......
  • 《向量数据库指南》揭秘:向量检索技术如何重塑AI应用格局?
    向量检索:AI时代的核心技术及其优化策略在AI技术日新月异的今天,向量检索(向量相似性搜索)无疑成为了推动技术进步和应用创新的重要引擎。作为大禹智库的向量数据库高级研究员,以及《向量数据库指南》的作者,我深知向量检索在AI时代所扮演的关键角色。它不仅在推荐系统、检索增强生......
  • html在线转换工具集合大全
    HTML转JS工具为您提供TML转JS,在线Html和Js代码互相转换工具:Js转Html,Javascript转Html,HTML转为Js,Html拼接为Js,Js脚本转为Html代码,Html代码转换,Js基本转换为HTML,Js在线转换,Html和Js脚本在线互转Js转Html代码工具为您提供在线Js转为HTML代码,Html转为Js脚本,Js转为HTML......
  • 短期面试突击攻略大全!2025最全Java面试题目合集
     这两年的面试难度确实要比往年高处很多。很多小伙伴投递了上千份简历,只有几家公司约面试。排除个人简历的因素,这在往年都是不太常见的。大厂缩招,于是很多往年能进大厂的人只能去卷中小厂,搞得层层内卷。 比如往年能有一万个人能进大厂,今年大厂只招聘一千个,那另外九千个在往......
  • 《向量数据库指南》——Milvus Cloud 2.5:Sparse-BM25引领全文检索新时代
    MilvusCloudBM25:重塑全文检索的未来在最新的MilvusCloud2.5版本中,我们自豪地引入了“全新”的全文检索能力,这一创新不仅巩固了MilvusCloud在向量数据库领域的领先地位,更为用户提供了前所未有的灵活性和效率。作为大禹智库的向量数据库高级研究员,以及《向量数据库指南》的......
  • UT 覆盖率 报告 dotnet-coverage
    安装dotnet-coverage和dotnet-reportgeneratordotnettoolinstall-gdotnet-coveragedotnettoolinstall-gdotnet-reportgenerator-globaltool运行测试,输出XML格式:dotnet-coveragecollect-fxml-ocoverage.xmldotnettest<solution/project>例如:在测试......
  • 12.18《代码大全2》读后感3
    进入阅读《代码大全2》的第三阶段,在代码世界中开启一场深度寻宝之旅。书中强调代码构建的系统性思维,使我认识到编写代码前规划架构的重要性,不能盲目堆砌功能。例如在大型项目里,合理分层与模块划分能避免混乱。其对变量命名、代码布局等细节的阐述也极为关键。清晰准确的变量命名......
  • 鸿蒙开发web组件开启深色模式与自定义 UserAgent
    鸿蒙开发web组件开启深色模式与自定义UserAgent设置深色模式ArkWeb支持对前端页面进行深色模式配置。通过darkMode()接口可以配置不同的深色模式,默认关闭。当深色模式开启时,Web将启用媒体查询prefers-color-scheme中网页所定义的深色样式,若网页未定义深色样式,则保持原状......
  • 【必看】内外网文件传输方法大全 看看哪个适合你!
    一、内外网文件传输的核心需求内外网文件传输的核心需求可以归纳为安全性、效率、合规性、兼容性、权限控制、自动化、部署灵活性和成本控制。企业应根据自身业务需求和安全策略,选择合适的解决方案来满足这些核心需求,实现高效、安全、合规的数据交换。二、内外网文件传输的方法......