首页 > 其他分享 >LongWriter: 基于LLM代理可以将输出窗口大小扩展到10,000+个单词

LongWriter: 基于LLM代理可以将输出窗口大小扩展到10,000+个单词

时间:2024-08-16 10:05:06浏览次数:12  
标签:10 输出 SFT LongWriter 000 LLM

LLM可以处理长达100,000个token的输入,但在生成超过2,000词的适度长度输出时仍然面临困难,因为模型的有效生成长度本质上受到其在监督微调(SFT)过程中所见样本的限制。

为解决这个问题,本文的作者引入了AgentWrite,这是一个基于代理的流程,它将超长生成任务分解为子任务,使现成的LLM能够生成超过20,000词的连贯输出。

主要贡献如下:

  • 介绍了限制当前(长上下文)LLM输出长度的主要因素,即SFT数据中对输出长度的约束。
  • 提出AgentWrite,使用分而治之的方法和现成的LLM自动构建具有超长输出的SFT数据。并且使用这种方法,构建了LongWriter-6k数据集。
  • 将LongWriter-6k数据集进行SFT训练,成功地将现有模型的输出窗口大小扩展到10,000+词,同时不影响输出质量。

https://avoid.overfit.cn/post/509d148d53554a28b7532a0b8b42ec61

标签:10,输出,SFT,LongWriter,000,LLM
From: https://www.cnblogs.com/deephub/p/18362356

相关文章

  • macOS和 Window10 命令行禁用/启用IPv6本地网络
    macOS禁用/启用IPv6本地网络禁用IPv6本地网络#验证是否可以访问IPv6网络$curl6.ipw.cn2408:824c:200::2b8b:336f:cc9c#找到网络设备的名字,这里用的是Wi-Fi(因为macbook用的是无线网络访问,即Wi-Fi)$networksetup-listallnetworkservicesAnasterisk(......
  • Cisco Nexus 9000v Switch, NX-OS Release 10.5(1)F - 用于网络原型设计和学习研究的
    CiscoNexus9000vSwitch,NX-OSRelease10.5(1)F用于网络原型设计和学习研究的虚拟化数据中心交换机请访问原文链接:https://sysin.org/blog/cisco-nexus-9000v/,查看最新版。原创作品,转载请保留出处。ReleaseDateNX-OSSystemSoftwareReleaseDateCiscoNX-OSRe......
  • Win10 部署 Confluence 文档管理系统
    Win10部署Confluence文档管理系统Docker部署参考:https://www.cnblogs.com/1285026182YUAN/p/183361881.confluence相关软件下载链接:https://pan.baidu.com/s/19fWURtXg7ZTYds0KrHumXA提取码:55q9。已存储在百度云下载文件如下: confluence破解工具文件:  2.首......
  • 银河麒麟系统V10(arm版)安装rocketmq说明
    #银河麒麟系统适配#随着2024年微软全球蓝屏丑闻的出现,系统安全越来越重要。目前很多企业开始尝试国产化操作系统上,本文介绍如何在国产化银河麒麟系统V10(arm)版上安装rocketmq。本资源是arm版本的rocketmq离线安装包,能够在arm版国产化银河麒麟系统上进行安装,并配置防火墙端口。......
  • Day 33 动态规划 Part10
    300.最长递增子序列动态规划的版本是挺好理解的,dp[i]代表了以第i个数字结尾的最长递增子序列的长度,dp[0]显然为1。dp如何更新呢?i>0:dp[i]=在i之前,最大的小于nums[i]的数nums[j]dp[i]=dp[j]+1,所以就是需要找到比nums[i]小的最大的数,遍历就可以得到。classSolution......
  • (路由卷1)-10-EIGRP不等价_认证
    eigrp不等价负载均衡需要关闭ipcefnoipcefroutereigrp100variance20(更改v值为最大的metric包含内)思科特快转发通过routingtable路由表生成cef的转发表(fib)把routingtable路由表作为控制层面把fib作为转发层面工程中拓展(如果有客户需要在没有fs做不等价)(10^7/mi......
  • 题解:P10313 [SHUPC 2024] 占地斗士!
    题目大意给出一个由.和#组成的\(n\timesm\)矩阵,然后再给你这\(4\)种图像,用着四种图像对矩阵进行覆盖(每个只能用一次)。其中,#的位置不可以被图像遮挡,也不能放在不能放置的格子上。解题思路考虑使用爆搜。第一个图像:if(mp[i][j]!='#'&&mp[i+1][j+1]!='#'......
  • 题解:P10111 [GESP202312 七级] 纸牌游戏
    题目大意给出三个序列:\(a\),\(b\),\(c\)分别表示:分数,罚分以及小杨从第\(1\)轮至第\(......
  • JavaScript 中,`'10' < '1'` 的结果为 `false`,原因
    在JavaScript中,'10'<'1'的结果为false,这是因为JavaScript在进行比较操作时,会将字符串按照字符编码进行比较,而不是将它们转换为数字。字符编码比较:字符串'10'的第一个字符是'1',而字符串'1'的第一个字符也是'1'。由于两个字符串的第一个字符相同,所以JavaScript......
  • 6种方法关闭Win10系统的自动更新
    6种方法关闭Win10系统的自动更新AIB网络中心 2023年12月04日09:33 广东这里我们将为您分享6种关闭Win10自动更新的方法,分别是通过Windows设置、WindowsUpdate服务、本地组策略编辑器、任务计划程序、注册表编辑器来关闭Win10自动更新。✔方法1.Windows设置要想关闭Win......