本仓库汇集了各种检索增强生成 (RAG) 系统的高级技巧。RAG 是一种流行的方法,它通过从可靠来源查找正确的信息并将其转化为有用的答案来提高准确性和相关性。本仓库涵盖了最有效的 RAG 高级技巧,并提供了清晰的实现和解释。
前排提示,文末有大模型AGI-CSDN独家资料包哦!
本仓库的主要目标是为希望在其项目中使用 RAG 高级技术的研发人员提供有用的资源。从零开始构建这些技术需要时间,找到合适的评估方法也可能具有挑战性。本仓库通过提供现成的实现和评估指南简化了这一过程。
注意: 本仓库从基础的 RAG 开始,逐步介绍高级技术。每个 RAG 技术都包含研究论文/参考文献,供您进一步阅读。
大型语言模型 (LLM) 在固定的数据集上进行训练,这限制了它们处理私有或最新信息的能力。它们有时会“幻觉”,提供不正确但看似可信的答案。微调可以有所帮助,但它成本高昂,并且不适合反复对新数据进行再训练。检索增强生成 (RAG) 框架通过使用外部文档来改进 LLM 的响应,从而解决了这个问题,它利用上下文学习来实现。RAG 确保 LLM 提供的信息不仅在上下文中相关,而且准确且最新。
RAG 主要包含四个组件:
•索引: 首先,将文档(任何格式)分割成块,并为这些块创建嵌入。然后将这些嵌入添加到向量存储中。•检索: 然后,检索器使用向量存储中的向量相似性等技术,根据用户的查询查找最相关的文档。•增强: 之后,“增强”部分将用户的查询与检索到的上下文组合成提示,确保 LLM 拥有生成准确响应所需的信息。•生成: 最后,将组合的查询和提示传递给模型,然后模型生成对用户查询的最终响应。
这些 RAG 组件允许模型访问最新、准确的信息,并根据外部知识生成响应。但是,为了确保 RAG 系统有效运行,必须评估其性能。
评估 RAG 应用对于了解这些系统的工作效率至关重要。通过检查其准确性和相关性,我们可以了解它们如何有效地将信息检索与生成模型相结合。这种评估有助于改进 RAG 应用在文本摘要、聊天机器人和问答等任务中的性能。它还可以找出改进的领域,确保这些系统在信息发生变化时提供可信的响应。总的来说,有效的评估有助于优化性能,并增强对 RAG 应用在实际应用中的信心。这些笔记本包含 Athina AI 中的端到端 RAG 实现 + RAG 评估部分。
以下是本仓库中涵盖的所有 RAG 技术的详细信息:
|
技术
|
工具
|
描述
|
| — | — | — |
|
简单 RAG (Naive RAG)
|
LangChain、Pinecone、Athina AI
|
将检索到的数据与 LLM 结合,以获得简单有效的响应。
|
|
混合 RAG (Hybrid RAG)
|
LangChain、Chromadb、Athina AI
|
结合向量搜索和 BM25 等传统方法,以获得更好的信息检索。
|
|
假设 RAG (Hyde RAG)
|
LangChain、Weaviate、Athina AI
|
创建假设文档嵌入,以查找与查询相关的资料。
|
|
父文档检索器 (Parent Document Retriever)
|
LangChain、Chromadb、Athina AI
|
将大型文档分解成小部分,如果一部分与查询匹配,则检索完整文档。
|
|
RAG 融合 (RAG fusion)
|
LangChain、LangSmith、Qdrant、Athina AI
|
生成子查询,使用倒排秩融合对文档进行排序,并使用最佳结果生成准确的响应。
|
|
上下文 RAG (Contextual RAG)
|
LangChain、Chromadb、Athina AI
|
压缩检索到的文档,只保留相关细节,以获得简洁准确的响应。
|
|
重写-检索-阅读 (Rewrite Retrieve Read)
|
LangChain、Chromadb、Athina AI
|
改进查询,检索更好的数据,并生成准确的答案。
|
|
校正 RAG (Corrective RAG)
|
LangChain、LangGraph、Chromadb、Athina AI
|
细化相关文档,删除不相关文档或进行网络搜索。
|
|
自我 RAG (Self RAG)
|
LangChain、LangGraph、FAISS、Athina AI
|
反思检索到的数据,以确保准确和完整的响应。
|
|
自适应 RAG (Adaptive RAG)
|
LangChain、LangGraph、FAISS、Athina AI
|
根据查询类型调整检索方法,使用索引数据或网络搜索。
|
每个笔记本的工作演示:demo.mp4
首先,使用以下命令克隆此仓库:
git clone https://github.com/athina-ai/rag-cookbooks.git
接下来,导航到项目目录:
进入“rag-cookbooks”目录后,按照每种技术的详细实现步骤操作。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
标签:检索,RAG,AI,模型,Athina,LangChain,大全 From: https://blog.csdn.net/2301_82275412/article/details/144611231