首页 > 其他分享 >从零开始的 CPT (Continual Pre-Training): 摆脱复杂的训练框架

从零开始的 CPT (Continual Pre-Training): 摆脱复杂的训练框架

时间:2024-12-01 22:11:34浏览次数:2  
标签:Pre pre Training 框架 训练 Factory train LLaMA Continual

由于要解决一些业务问题,需要将领域知识喂给大模型。之前只做过简单的 finetuning(在 GLM 的框架上跑了一些 lora,数据量也不大),但是现在要将整个细分工业领域的相关数据都收集起来训练,规模上比之前半手动构造的微调数据集要大了很多,调研了一圈,更适合在 pre-train 阶段去做训练。

尝试使用训练框架:

  • LLaMA Factory
    是的,大名鼎鼎的 LLaMA Factory 不仅能 finetune,还能做 pre-train 阶段的训练。这个还是阿里的朋友告知才知道的...
  • GPT-NeoX
    高性能训练框架。人家 Readme 中就提醒了,心里没点数别来用我:

If you are not looking to train models with billions of parameters from scratch, this is likely the wrong library to use.

  • Pai-Megatron-Patch
    跟 GPT-NeoX 一样是基于 Megatron 的训练框架,不过感觉阿里除了 antd 就没啥好用的开源项目...

说实话,这些框架的使用配置还是有些复杂(对于我这样的 pre-train 菜鸟来说),光是看文档就能把自己绕进去。

当然 LLaMA Factory 的使用还是比较傻瓜式的,毕竟是有 UI 操作界面的,点点点就能把最终运行的 command line 拼出来,就是它在产品的设计上完全是为了 finetune 而生的,感觉完全没有考虑 pre-train 这个 feature,而且出来的结果也非常诡异。比如 stage 选项中,pre-train 是排在最下面的;我明明选的是 pre-train,无论是训练开始前的命令行预览,还是训练的结果保存路径,都包含了 lora 是怎么回事?一头雾水,文档也不清楚。

那有没有可能不使用这些高大上的训练框架呢?我只想简简单单验证一下技术可行性,那只能从 transformer 库入手了。

标签:Pre,pre,Training,框架,训练,Factory,train,LLaMA,Continual
From: https://www.cnblogs.com/cdyang/p/18565259/cpt-vanilla-pytorch

相关文章

  • 【PR2024】Adobe Premiere Pro视频编辑软件下载安装与功能介绍
    目录AdobePremierePro软件简介一、软件简介1.1软件背景1.2软件特点1.3适用人群二、系统要求2.1操作系统要求2.2硬件要求2.3显示要求三、下载方法四、功能介绍4.1非线性编辑4.2多种格式支持4.3效果与调整4.4合作与分享功能4.5插件和扩展4.6移动......
  • 【pr】Adobe Premiere Pro强大的视频编辑软件下载安装
    目录PR软件简介一、软件简介1.1软件特点1.2应用场景1.3系统要求二、下载方法三、安装步骤3.1Windows系统安装3.2macOS系统安装PR软件简介AdobePremierePro2024是Adobe公司推出的一款强大的视频编辑软件,广泛应用于影视制作、视频广告、网络视频等领域。作......
  • reinterpret_cast解读
    reinterpret_cast 是C++中的一种强制类型转换运算符,用于在不同类型之间进行低级的指针或引用转换。与其他类型转换(如 static_cast 和 dynamic_cast)不同,reinterpret_cast 允许你进行更底层、更危险的转换,它直接将一个类型的位模式重新解释为另一个类型。这种转换通常用于底......
  • offline RL · PbRL | LiRE:构造 A>B>C 的 RLT 列表,得到更多 preference 数据
    论文标题:ListwiseRewardEstimationforOfflinePreference-basedReinforcementLearning,ICML2024。arxiv:https://arxiv.org/abs/2408.04190pdf:https://arxiv.org/pdf/2408.04190html:https://ar5iv.org/html/2408.04190GitHub:https://github.com/chwoong/LiRE(感觉关于......
  • 用VuePress在GitHub Pages上搭建博客
    请先点击链接RobinDevNotes,体验用VuePress搭建博客的效果(logo还没有合适的替换),目前部署在GitHubPages上,国内访问速度还可以,再阅读本文感受来龙去脉和搭建过程。最近准备自己要写点小项目,当前技术栈是以运维和后端为主,自己要写项目的话还是要会一些前端技术,选择学习国内比较流行......
  • 241128伞阀-流体压力载荷 Fluid Penetration Pressure
    1.橡胶块材料(1)Mooney-Rivlin2参数(来源:忘了):【材料常数C10:1.1e+6Pa 【材料常数C01:1.1e+5Pa 【不可压缩性参数D1:1e-5Pa^-1】(2)(来源:X343-流体渗透压力分析-百度文库)(3)APDLShowcase中采用的橡胶参数【一阶Ogden超弹性模型】摩擦参数为0.1,塑料封盖杨氏模量为171.47MP......
  • 宝塔安装wordpress打不开
    当你在宝塔面板上安装了WordPress但无法打开时,可以尝试以下几个步骤来排查和解决问题:检查网站配置确认在宝塔面板中,WordPress站点的配置是否正确,包括域名、端口等信息。检查站点的伪静态设置是否已开启,对于WordPress,通常需要启用伪静态规则。检查数据库连接确保WordPr......
  • DevExpress WinForms中文教程:Data Grid - 如何完成列调整?
    DevExpressWinForms拥有180+组件和UI库,能为WindowsForms平台创建具有影响力的业务解决方案。DevExpressWinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜任!本文主要介绍如何使用DevExpressWinForms的DataG......
  • DevExpress WinForms v24.2新功能预览 - 报表查看器和设计器全新升级
    DevExpressWinForms 拥有180+组件和UI库,能为WindowsForms平台创建具有影响力的业务解决方案。DevExpressWinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜任!获取DevExpressWinFormsv24.1正式版下载DevEx......
  • stopPropagation()和preventDefault()这两个方法有什么区别?
    stopPropagation()和preventDefault()是JavaScript中用于事件处理的两个重要方法,它们的主要区别在于它们针对事件的不同方面:stopPropagation()阻止事件冒泡:当一个元素上的事件被触发时,例如点击一个按钮,该事件会沿着DOM树向上冒泡,触发其父元素、祖先元素上的相同事件......