首页 > 其他分享 >大模型 RAG 是什么

大模型 RAG 是什么

时间:2024-04-10 19:22:19浏览次数:15  
标签:检索 RAG 知识 模型 知识库 生成 什么

大模型 RAG(Retrieval-Augmented Generation)是一种结合了检索(Retrieval)与生成(Generation)能力的先进人工智能技术,主要用于增强大型语言模型(LLMs,Large Language Models)在特定任务中的表现,特别是那些需要访问外部知识库或实时信息的任务。

RAG 模型旨在克服 LLMs 存储容量有限、难以即时获取最新信息以及在特定领域知识不足等问题,通过集成检索机制来辅助模型生成更加准确、详尽且具有针对性的答案。以下是 RAG 模型的详细说明:

1.核心思想:

检索与生成结合:RAG 将检索系统与生成模型无缝衔接,形成一个混合模型架构。当接收到一个查询或问题时,模型首先通过检索模块从大规模知识库中寻找与查询相关的信息片段(如文本片段、文档摘要、知识条目等)。

知识增强:检索到的相关信息被作为额外输入传递给生成模型,使得模型在生成回答时不仅依赖于自身的内部知识,还能利用实时检索到的外部知识资源,从而丰富其输出内容,提高答案的准确性、全面性和时效性。

2.架构组成:

检索模块:通常是一个高效的搜索引擎或索引系统,负责根据查询语句从预先构建的知识库中快速定位并提取相关信息。检索模块可能采用向量相似度搜索、关键词匹配、深度学习嵌入匹配等技术。

生成模型:通常是一个预训练的大型语言模型(如 GPT、BERT 或 T5),具备强大的语言理解和生成能力。生成模型接收查询和检索结果作为输入,综合两者信息生成最终答案。在某些实现中,检索结果可能以注意力机制的形式融入到生成模型的计算过程中。

3.工作流程:

查询阶段:用户提交一个问题或查询,RAG 模型首先通过检索模块在知识库中搜索与查询相关的文档或片段。

融合阶段:检索到的候选文档或片段被编码成向量形式,与查询语句一起作为输入传递给生成模型。生成模型学习如何有效地结合内部知识与检索到的外部知识来生成答案。

生成阶段:生成模型基于整合的信息生成回答。这一过程可能涉及解码器网络的自回归生成,其中检索结果的贡献以某种形式(如注意力权重)影响生成步骤。

4.应用场景与优势:

开放式问答:在没有预设答案范围的环境中,RAG 能够检索广泛的知识库以提供准确答案,尤其适合处理需要实时更新信息或专业知识的问题。

垂直领域问答:在医疗、法律、金融等专业领域,RAG 可以结合特定领域的知识库,提高模型在专业问答场景下的表现,如同参加一场可以查阅资料的开卷考试。

对话系统:在对话交互中,RAG 能够即时检索相关信息以提供详尽、精确的回答,提升对话系统的知识性和互动体验。

优势:RAG 模型能够利用大规模知识库,解决 LLMs 存储容量有限、知识更新滞后、领域知识不足等问题,增强模型的泛化能力、知识新鲜度和领域适应性。

5.发展与演化:

模块化设计:一些 RAG 实现采用了模块化结构,将系统划分为不同类型模块和运算符,以实现高度可扩展性和定制化配置,适应不同应用场景的需求。


综上所述,大模型 RAG 是一种结合了检索与生成技术的混合型 AI 模型,它通过引入外部知识库检索机制,增强了大型语言模型在解答复杂问题、处理实时信息以及适应特定领域知识需求等方面的能力。RAG 在开放式问答、专业领域问答、对话系统等场景中展现出显著优势,是提升语言模型实用性和智能化水平的重要发展方向。

 

Online Tool

Link:https://www.cnblogs.com/farwish/p/18127201

标签:检索,RAG,知识,模型,知识库,生成,什么
From: https://www.cnblogs.com/farwish/p/18127201

相关文章

  • embedding models 是什么
    embeddingmodels是一类机器学习模型,它们的核心功能是将高维、离散的输入数据(如词汇、类别标签、节点或实体)映射到低维、连续的向量空间中。这些向量(即embeddings)通常具有丰富的语义信息,并能够捕捉原始数据之间的潜在关系和相似度。以下是对embeddingmodels的详细说明: 1.......
  • 机器学习——常见模型评估指标
    目录一.模型评估综述1.1什么是模型评估1.2评估类型1.3模型泛化能力1.4过拟合与欠拟合1.4.1过拟合1.4.2欠拟合二.常见的分类模型评估方式2.1混淆矩阵2.2准确率(Accuracy)2.3精确率(Precision)2.4召回率(Recall)2.5F1-score2.6ROC曲线及AUC值2.7PR曲线三.PR曲线和ROC曲线的......
  • 知识图谱在RAG中的应用探讨
    在这篇文章中,我们来详细探讨知识图谱(KG)在RAG流程中的具体应用场景。缘起关于知识图谱在现在的RAG中能发挥出什么样的作用,之前看了360刘焕勇的一个分享,简单的提了使用知识图谱增强大模型的问答效果的几个方面:在知识整理阶段,用知识图谱将文档内容进行语义化组织;在意图识别阶段......
  • NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及LLM大模型(Spider vs BIRD)全面对比
    NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及LLM大模型(SpidervsBIRD)全面对比优劣分析[Text2SQL、Text2DSL]Text-to-SQL(或者Text2SQL),顾名思义就是把文本转化为SQL语言,更学术一点的定义是:把数据库领域下的自然语言(NaturalLanguage,NL)问题,转化为在关系型数据库中可以执行的......
  • 安防视频监控/视频集中存储EasyCVR平台开启鉴权后设备列表不展示是为什么?
    安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,EasyCVR基于云边端一体化架构,具有强大的数据接入、处理及分发能力,可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲、智能AI分析接入等功......
  • new mars3d.graphic.PolylineEntity({实现航线真实穿过山体或者模型的部分用虚线展示
    1.在官网示例中通过 newmars3d.graphic.PolylineEntity({实现航线真实穿过山体或者模型的部分用虚线展示效果2.示例地址:功能示例(Vue版)|Mars3D三维可视化平台|火星科技3.实现效果: 1.航线真实穿过山体或者模型的部分用虚线展示、并且是(真实穿过不是视线挡住那种),遮挡......
  • 【转载】在SAP HANA中创建普通用户进行模型视图开发的权限设置
    转载自SAPComumunity模型视图是SAPHANA中一个重要的组成部分,它包括属性视图、分析视图以及计算视图。正确地使用模型视图进行开发,不仅能够在团队开发中使开发人员对业务理解能有更好的传递作用,也能够对业务场景进行加速,提高执行速度。相信读者之前对于模型视图的概念已经有了......
  • cpp 内存分区模型
    c++程序在执行前,将内存大方向划分为4个区域。1.代码区:存放函数的二进制代码,有操作系统进行管理2.全局区:存放全局变量和静态变量以及常量3.栈区:由编译器自动分配释放,存放的函数参数和局部变量4.堆区:由程序员分配释放,若程序员不分配释放,程序结束时由操作系统回收不同区域存......
  • 【TensorRT】TensorRT C# API 项目更新 (1):支持动态Bath输入模型推理(下篇)
    4.接口应用关于该项目的调用方式在上一篇文章中已经进行了详细介绍,具体使用可以参考《最新发布!TensorRTC#API:基于C#与TensorRT部署深度学习模型》,下面结合Yolov8-cls模型详细介绍一下更新的接口使用方法。4.1创建并配置C#项目 首先创建一个简单的C#项目,然后添加项......
  • jmeter监控服务器工具jp@gc - PerfMon Metrics Collector(ServerAgent)
    一、在服务器上安装ServerAgentSeverAgent:这个工具,可以和jmeter集成,在jmeter的GUI界面可以看到数据。链接:https://pan.baidu.com/s/1k3xlXk35YfPmS17-2ZFBnA?pwd=5s4n提取码:5s4n复制这段内容后打开百度网盘手机App,操作更方便哦使用unzip命令解压文件......