首页 > 其他分享 >检索增强生成RAG

检索增强生成RAG

时间:2024-02-02 18:33:00浏览次数:22  
标签:检索 RAG 训练 模型 知识库 生成 LLM 查询

什么是RAG

检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在 LLM 本就强大的功能基础上,RAG 将其扩展为能访问特定领域或组织的内部知识库,所有这些都无需重新训练模型。这是一种经济高效地改进 LLM 输出的方法,让它在各种情境下都能保持相关性、准确性和实用性。

为什么不直接查询知识库

如果我们直接查询知识库的话,得到的结果是一段一段和查询相关的数据片段,需要人一个一个去筛选,而把查询结果直接给大模型,让大模型去消化吸收组织语言回答。大模型训练的是一种回答问题的能力。

为什么不把知识库直接加入训练

大模型参数量大,训练成本高,要得到一个稳定的大模型,需要消耗大量的资源。包括标注以及硬件成本,时间成本。做不到边训练边服务。每次有新的知识然后都要加进去训练的话,成本就更高了。并且并不能解决大模型幻觉问题。

如果知识库力查到的内容过多,上下文装不下怎么办

外部知识是分片处理,并且是用向量数据库。存储的是文本的语义特征。


标签:检索,RAG,训练,模型,知识库,生成,LLM,查询
From: https://blog.51cto.com/u_15942288/9560554

相关文章

  • laravel8 生成pdf
    privatestaticfunctioncreatePdfSendEmail($job_notes_id){#信息$recruit_job_notes_auth=DB::table('notes_auth')->select(["mobile","job_id"])->find($job_notes_id);if(!$recruit_job_note......
  • JWT的生成和校验
    JWT(JSONWebToken)是一种开放标准(RFC7519),用于在网络上安全传输信息的简洁、自包含的方式。它通常被用于身份验证和授权机制。JWT由三部分组成:头部(Header)、载荷(Payload)和签名(Signature)。1、头部(Header):包含了关于生成该JWT的信息以及所使用的算法类型。2、载荷(payload): ......
  • 新型生成式 AI 助手 Amazon Q(预览版)上线
    今天,我们宣布推出AmazonQ,这是一种新型的生成式人工智能助手,专门用于满足办公场景需要,可以根据客户业务进行定制。客户可以使用AmazonQ进行对话、解决问题、生成内容、获取见解并采取行动,所有这些都基于客户自身的信息存储库、代码、数据和企业系统。AmazonQ为员工提供即时......
  • 最小生成树
    概念 第1题   生成树任何一个无向连通图的最小生成树 1.有一棵或多棵   正确 2.只有一棵 错误 3.一定有多棵 错误 4.可能不存在 错误  第2题   生成树有几个以下叙述中,正确的是()1.只要无向连通图中没有权值相同的边,则其最小生成树......
  • UniGUI使用ADO组件、调用数据库的存储过程、生成EXECL表的例子
    UniGUI使用ADO组件、调用数据库的存储过程、生成EXECL表的例子(自己学习记录一下,不一定合理,仅供参考)本例子是使用ADO等组件连接一个云服务器的一个数据库,调用GetOrg存储过程,把机构信息展现把结果导出的一个EXECL表里,并下载把显示的HSate的值进行替换1表示正常,其他表示暂停......
  • 3. 统计学生成绩
    objecttest3{caseclassstudent(id:String,gender:String,score:Map[String,Int])//读取文件的方法:definputStudentList(filename:String):List[student]={//读取文件并按行进行切割varlines=scala.io.Source.fromFile(filename).getLine......
  • 文心一言APP上线新功能,一张照片、三句话即可生成专属数字分身
    只需一张照片、录制三句话,就能拥有一个自己的数字分身?这不是科幻电影,而是文心一言APP上线的新功能-数字分身。目前,文心一言APP正在内测数字分身新功能,明天起,iOS和Android用户升级新版本后,均可免费使用该功能,极速体验创建和使用数字分身的乐趣。据了解,文心一言APP新功能极大缩短了......
  • 【IEEE出版|往届均已EI检索】第四届电子,电路和信息工程国际学术会议(ECIE 2024)
    大会时间:2024年5月24-26日|中国-杭州主办单位:浙江工业大学接受/拒稿通知:投稿后1周左右收录检索:IEEEXplore收录,EI,Scopus参会类型:全文投稿、口头报告、海报展示、仅参会会议官网:https://www.ais.cn/attendees/index/ZBJRJN参会方式:全文投稿、口头报告、海报展示、仅参会......
  • laravel生成二维码,并添加背景图片,图标logo
    1、安装组件composerrequiresimplesoftwareio/simple-qrcode1.3.*在 config/app.php 注册服务提供者:SimpleSoftwareIO\QrCode\QrCodeServiceProvider::class同样在 config/app.php 添加 QrCode 门面:'QrCode'=>SimpleSoftwareIO\QrCode\Facades\QrCode::class2......
  • 后台生成单个Word文档
    在实际项目开发中经常会遇到一种场景,客户希望点击页面上的生成文件按钮,执行程序动态填充数据到Word模板,直接在后台生成Word文档,而无需显示Word文档。目前网上有一些针对此需求的方案,但每个方案都存在很多各自的问题。与其他方案对比采用Jacob生成Word文档方案动态生成的Word文......