首页 > 其他分享 >九析带你轻松完爆AI大模型(九)---RAG介绍

九析带你轻松完爆AI大模型(九)---RAG介绍

时间:2024-11-14 22:46:27浏览次数:3  
标签:完爆 RAG 检索 九析 Sequence 模型 Seq2Seq LLM

申明:九析唯一授权【超级网红系列课程——AI 大模全栈型架构师】系列课程


邀约

        诚挚邀请您关注公众号,通过公众号加入群聊和我们一起完爆世界,有任何问题在群里我们一起探讨......期待与您的见面!

 一、RAG简介

        众所周知,我们在使用大语言模型做应用开发的过程中,享受大模型带给我们智能化体验的同时,也遭遇了一些,大语言模型自身的局限与不足,主要包括以下三点:

  1. 幻觉:大语言模型文本生成底层基于概览,有时会胡说八道
  2. 数据新鲜度:大语言模型因训练成本高,数据新鲜度有限,过了这个时限后的事情就不知道了
  3. 数据安全:企业把数据、文件等上传大模型会造成信息泄露

        还有推理速度慢,推理结果不稳定,推理结果可解释性差等等,这里就不一而足了

        以上的问题影响了大模型的推广和应用,很长一段时间以来,以ChatGPT为首的大模型只在某些容错率高的场景使用,比如:音乐、绘画、个人提效上有一席之地,却难以应用在政府机构和企事业单位,等实际业务经营场景中。直至RAG等相关技术的成熟与发展,大模型应用叫好不叫座的现状才逐步得以改善

二、RAG来源

        RAG 是Retriever Augmented Generation ‘检索增强生成’一词的缩写,检索到结果后也不是将结果原封不动的返回,而是经过再次加工处理后才将结果返回给用户。

        RAG最早是在2020年出现在Facebook AI Research(即:FAIR团队),发表了一篇名为《Retriever Augmented Generation for Knowledgeable-Intensive NLP tasks》的论文当中。

三、模型架构介绍

        RAG的核心是由检索器(Retriever)生成器(Generator)组成,作者将两个模型连接在一起,并进行了全链路的微调(Fine-tuning),其中检索器模型又由查询编码器(Query Encoder)和文档索引(Document Index)两部分构成,查询编码器负责将用户输入的自然语言查询语句,转换成机器可以理解的机器语言,再通过 MIPS(最大内积搜索算法),从文档索引器中检索出预先定义的最多‘K’个文档(即:Top-K),然后传给文本生成器(即:Sequence to Sequen 字符序列)模型,再有 Sequence to Sequen 产生结果,然后返回给先前查询的用户。

        整个过程非常像传统的搜索,但又跟传统的搜索有很大的不同,传统搜索是基于关键词和倒排索引。

        而这里能是采用向量,采用向量的好处是支持语义检索。

        比如:我喜欢你,我爱你,我中意你。

四、Sequence to Sequen介绍

        Seq2Seq(Sequence to Sequence,序列到序列模型) 是一种循环神经网络的变种,包括编码器 (Encoder) 解码器 (Decoder) 两部分。Seq2Seq 是自然语言处理中的一种重要模型,可以用于机器翻译、对话系统、自动文摘

        Seq2Seq被提出于2014年,最早由两篇文章独立地阐述了它主要思想,分别是Google Brain团队的《Sequence to Sequence Learning with Neural Networks》和Yoshua Bengio团队的《Learning Phrase Representation using RNN Encoder-Decoder for Statistical Machine Translation》。这两篇文章针对机器翻译的问题不谋而合地提出了相似的解决思路,Seq2Seq由此产生。

五、RAG定义

        RAG: 全称“Retrieval Augmented Generation」检象增强生成。结合了信息检索技术和LLM 。自研 RAG系统先从私有或特定领域的文档库中检索到用户查询的上下文信息,LLM 再根据检索到的上下文信息生成最终答案。RAG可以提高文本生成的质量和准确性。这里需注意,RAG 不仅仅是搜索到警,不管 RAG多历害,还是基于 LLM,脱离了LLM,就会变得没有“人味儿”。


        感谢各位老爷的观看!!!        

        可以直接观看视频:九析带你轻松完爆AI大模型   别忘了一键三连,您的支持是九析更新的最大动力。

标签:完爆,RAG,检索,九析,Sequence,模型,Seq2Seq,LLM
From: https://blog.csdn.net/yangpiqiulaotou/article/details/143780356

相关文章

  • 通过 AWR报告查看oracle 数据库服务器的负载(load average)异常高的原因
    要诊断Oracle数据库服务器的负载(loadaverage)异常高的原因,通过AWR(AutomaticWorkloadRepository)报告可以帮助你识别潜在的瓶颈或负载源。AWR报告提供了数据库的详细性能数据,涵盖了系统负载、SQL执行、I/O性能、内存使用等多方面的信息。以下是通过AWR报告查看和诊断高负......
  • 优化RAG索引策略:多向量索引与父文档检索技术
    引言在RAG(检索增强生成)系统中,索引策略直接影响检索的效率和准确性。本文将深入探讨两种先进的索引优化技术:多向量索引和父文档检索,以及一种高级的RAG优化策略——RAPTOR。这些技术能够显著提升RAG系统的性能,尤其是在处理长文档和复杂查询时。多向量索引技术多向量索引的概念多......
  • 深入理解RAG查询转换优化:多查询、问题分解与回答回退
    引言在RAG(检索增强生成)系统中,查询转换是影响检索质量的关键环节。本文将深入探讨三种先进的查询转换优化策略:多查询重写、问题分解以及回答回退(Step-Back)。这些策略不仅能显著提升检索准确性,还能有效处理复杂查询场景。多查询重写策略原理与优势多查询重写策略的核心思想是通......
  • RAG检索性能提升实践:混合检索与自查询技术详解
    引言在RAG(检索增强生成)系统中,检索性能直接影响着最终的生成质量。本文将深入探讨两种先进的检索优化技术:混合检索和自查询检索。这些技术能显著提升检索的准确性和灵活性,为RAG系统带来实质性的性能提升。混合检索技术详解混合检索的核心原理混合检索通过集成多种检索算法,充分......
  • RAG 应用优化策略:从文档处理到检索技巧
    引言RAG(检索增强生成)应用的性能很大程度上取决于文档处理、分割策略和检索方法的优化。本文将系统地介绍RAG应用的各个环节优化策略,帮助开发者构建更高效的RAG系统。文档预处理优化非分割类型的文档转换器1.问答转换器(QATransformer)问答转换器可以将文档转换为问答对的......
  • 自定义 LangChain 组件:打造专属 RAG 应用
    引言在构建专业的检索增强生成(RAG)应用时,LangChain提供了丰富的内置组件。然而,有时我们需要根据特定需求定制自己的组件。本文将深入探讨如何自定义LangChain组件,特别是文档加载器、文档分割器和检索器,以打造更加个性化和高效的RAG应用。自定义文档加载器LangChain的文档......
  • Intro to LLM Agents with Langchain: When RAG is Not Enough
    https://towardsdatascience.com/intro-to-llm-agents-with-langchain-when-rag-is-not-enough-7d8c08145834Asalways,youcanfindthecodeonGitHub,andhereareseparateColabNotebooks:PlanningandreasoningDifferenttypesofmemoriesVarioustypesof......
  • 在 Github Action 管道内集成 Code Coverage Report
    GithubActions我们的开源项目Host在Github,并且使用它强大的Actions功能在做CICD。单看GithubActions可能不知道是啥。其实它就是我们常说的CICDpipeline或者叫workflow。当我们Push代码到Github,它会自动触发这些管道。它会帮我们自动build代码,跑testcases,构......
  • localStorage和sessionStorage的区别
    `localStorage`和`sessionStorage`都是浏览器提供的本地存储方案,它们之间有几个关键的区别,包括数据的生命周期、作用域以及存储容量等方面。1.**区别:**  -**生命周期:**   -`localStorage`:存储的数据没有过期时间限制,除非显式删除或浏览器缓存被清除,否则数据将一......
  • 九析带你轻松完爆AI大模型(四)---模型篇①
    申明:九析唯一授权【超级网红系列课程——AI大模型全栈架构师】系列课程一、模型篇大纲大语言模型基础大语言模型预训练大语言模型微调大语言模型强化对齐大语言模型评估大语言模型压缩大语言模型工程大语言模型安全多模态模型大模型经典论文Pytorch......