DeepMind的新论文，长上下文的大语言模型能否取代RAG或者SQL这样的传统技术呢?

时间：2024-07-01 10:53:40浏览次数：19

长上下文大型语言模型（LCLLMs）确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为，LCLLMs不需要像RAG这样的外部工具，这有助于优化并避免级联错误。但是也有许多人对此持怀疑态度，并且后来的研究表明，这些模型并没有真正利用长上下文。还有人声称，LCLLMs会产生幻觉错误，而其他研究则表明，较小的模型也能高效解决这些任务。

关于长上下文大型语言模型是否真正利用其巨大的上下文窗口，以及它们是否真的更优越，这些问题仍然没有定论，因为目前还没有能够测试这些模型的基准数据集。

但是要充分发挥LCLLMs的潜力，需要对真正的长上下文任务进行严格评估，这些任务在现实世界应用中很有用。现有的基准测试在这方面表现不佳，它们依赖于像“大海捞针”这样的合成任务或固定长度的数据集，这些数据集无法跟上“长上下文”的不断发展的定义。

所以DeepMind最近构建了一个名为Long-Context Frontiers（LOFT）新基准数据集，试图解决这一不足。这个新数据集包括六个任务，涵盖了35个数据集，这些数据集跨越文本、视觉和音频模态。

https://avoid.overfit.cn/post/8e48436858674be0a0b9306afecb13bc

标签：RAG,模型,任务,DeepMind,SQL,上下文,LCLLMs
From： https://www.cnblogs.com/deephub/p/18277581

mysql 主从一致性检测与修复
percona-toolkit下载需要安装的依赖包[centos7]yum-yinstallperl-Digest-MD5perl-DBIperl-DBD-MySQL--nogpgcheck--disablerepomysql80-community--enablerepomysql57-community原理将一张大表分成多个chunk，每次针对一个chunk进行校验，同时将校验的结果通过REPL......
PostGreSQL在线扩展PostGIS
1简介当需要进行地理信息系统(GIS)查询时，安装和使用PostGIS扩展非常有用。它允许你在PostgreSQL中存储、查询和分析地理和空间数据，例如范围查询、距离计算、地理坐标转换等。使用合适的地理索引来加速查询；考虑将地理数据规范化以降低存储开销；2安装扩展所......
（免费领源码）java#Springboot#mysql物品代拿系统32500-计算机毕业设计项目选题推荐
摘要科技进步的飞速发展引起人们日常生活的巨大变化，电子信息技术的飞速发展使得电子信息技术的各个领域的应用水平得到普及和应用。信息时代的到来已成为不可阻挡的时尚潮流，人类发展的历史正进入一个新时代。在现实运用中，应用软件的工作规则和开发步骤，采用Java技术开发，Sp......
webAPI连接SQLserver，并快速建立数据模型
首先，你需要有一个webAPI来作为Android应用和SQLserver数据库之间的中间件，创建该api在项目中导入三个NuGet包通过服务器资源管理器连接数据库，获取数据库连接的字符串快速建立数据模型思路：通过数据库创建数据类：导入包=>打开程序包管理器控制台=>选择项目=>Scaffold-DbCont......
sqli-labs基础篇（1-22）
‍less-1字符型判断是否存在sql注入?id=1and1=1--+?id=1'and1=1--+?id=1'and1=2--+说明存在sql注入，并且注入类型为字符型注入联合注入先判断列数?id=1'orderby3--+有回显?id=1'order......
乌班图Ubuntu 24.04初始化MySQL报错error while loading shared libraries: libaio.so
由于乌班图24.04LTS已经发布了，因此准备新业务逐步往这上面迁移，毕竟支持有效期比22.04更长准备在24.04上进行MySQL的初始化，因为习惯自定义安装存储目录，所以使用mysql-8.0.37-linux-glibc2.28-x86_64.tar.xz这个最新的二进制版本。按照22.04版本整理的安装笔记进行操作，第一步安装......
Oracle PL / SQL 函数
FUNCTION是返回值的PL/SQL块或方法，因此它可以在赋值的右侧使用。这里是一个例子：n_value:=to_number('123.45');由于FUNCTION返回一个值，因此也可以在SQL语句中使用它，如下例所示：selectto_number('1')fromdual;创建函数让我们创建一个无错的to_number（）函数，而不......
Oracle PL / SQL 存储过程
PL/SQL存储过程不返回值。他们执行他们的指示并返回。您不能在赋值语句（如函数）的右侧使用存储过程。创建存储过程以下代码是一个非常简单的存储过程示例。它基于SYS.DBMS_LOCK包的程序sleep（数量）。此存储过程将停止执行指定的秒数。CREATEORREPLACEPROCEDUREwait(ai......
【AI 大模型】大模型应用架构 ( 业务架构 - AI Embedded、AI Copilot、AI Agent | 技
文章目录一、大模型技术方向-大模型训练/大模型应用二、大模型应用-业务架构1、AIEmbedded模式2、AICopilot模式3、AIAgent模式三、大模型应用-技术架构1、提示词技术架构2、Agent+FunctionCalling技术架构3、RAG技术架构4、Fine-tuning微调技术......
Mysql表的增删改查详解
3.表的增删改查创建一个学生表DROPTABLEIFEXISTSstudent;CREATETABLEstudent(idINT,snINTcomment'学号',nameVARCHAR(20)comment'姓名',qq_mailVARCHAR(20)comment'QQ邮箱');单行数据+全列插入插入两条记录，value_list数量必须......

DeepMind的新论文，长上下文的大语言模型能否取代RAG或者SQL这样的传统技术呢?

相关文章

赞助商

阅读排行