从零开始的 CPT (Continual Pre-Training): 摆脱复杂的训练框架

时间：2024-12-01 22:11:34浏览次数：2

标签：Pre pre Training 框架训练 Factory train LLaMA Continual

由于要解决一些业务问题，需要将领域知识喂给大模型。之前只做过简单的 finetuning（在 GLM 的框架上跑了一些 lora，数据量也不大），但是现在要将整个细分工业领域的相关数据都收集起来训练，规模上比之前半手动构造的微调数据集要大了很多，调研了一圈，更适合在 pre-train 阶段去做训练。

尝试使用训练框架：

LLaMA Factory
是的，大名鼎鼎的 LLaMA Factory 不仅能 finetune，还能做 pre-train 阶段的训练。这个还是阿里的朋友告知才知道的...
GPT-NeoX
高性能训练框架。人家 Readme 中就提醒了，心里没点数别来用我：

If you are not looking to train models with billions of parameters from scratch, this is likely the wrong library to use.

Pai-Megatron-Patch
跟 GPT-NeoX 一样是基于 Megatron 的训练框架，不过感觉阿里除了 antd 就没啥好用的开源项目...

说实话，这些框架的使用配置还是有些复杂（对于我这样的 pre-train 菜鸟来说），光是看文档就能把自己绕进去。

当然 LLaMA Factory 的使用还是比较傻瓜式的，毕竟是有 UI 操作界面的，点点点就能把最终运行的 command line 拼出来，就是它在产品的设计上完全是为了 finetune 而生的，感觉完全没有考虑 pre-train 这个 feature，而且出来的结果也非常诡异。比如 stage 选项中，pre-train 是排在最下面的；我明明选的是 pre-train，无论是训练开始前的命令行预览，还是训练的结果保存路径，都包含了 lora 是怎么回事？一头雾水，文档也不清楚。

那有没有可能不使用这些高大上的训练框架呢？我只想简简单单验证一下技术可行性，那只能从 transformer 库入手了。

标签：Pre,pre,Training,框架,训练,Factory,train,LLaMA,Continual
From： https://www.cnblogs.com/cdyang/p/18565259/cpt-vanilla-pytorch

【PR2024】Adobe Premiere Pro视频编辑软件下载安装与功能介绍
目录AdobePremierePro软件简介一、软件简介1.1软件背景1.2软件特点1.3适用人群二、系统要求2.1操作系统要求2.2硬件要求2.3显示要求三、下载方法四、功能介绍4.1非线性编辑4.2多种格式支持4.3效果与调整4.4合作与分享功能4.5插件和扩展4.6移动......
【pr】Adobe Premiere Pro强大的视频编辑软件下载安装
目录PR软件简介一、软件简介1.1软件特点1.2应用场景1.3系统要求二、下载方法三、安装步骤3.1Windows系统安装3.2macOS系统安装PR软件简介AdobePremierePro2024是Adobe公司推出的一款强大的视频编辑软件，广泛应用于影视制作、视频广告、网络视频等领域。作......
reinterpret_cast解读
reinterpret_cast 是C++中的一种强制类型转换运算符，用于在不同类型之间进行低级的指针或引用转换。与其他类型转换（如 static_cast 和 dynamic_cast）不同，reinterpret_cast 允许你进行更底层、更危险的转换，它直接将一个类型的位模式重新解释为另一个类型。这种转换通常用于底......
offline RL · PbRL | LiRE：构造 A>B>C 的 RLT 列表，得到更多 preference 数据
论文标题：ListwiseRewardEstimationforOfflinePreference-basedReinforcementLearning，ICML2024。arxiv：https://arxiv.org/abs/2408.04190pdf：https://arxiv.org/pdf/2408.04190html：https://ar5iv.org/html/2408.04190GitHub：https://github.com/chwoong/LiRE（感觉关于......
用VuePress在GitHub Pages上搭建博客
请先点击链接RobinDevNotes，体验用VuePress搭建博客的效果（logo还没有合适的替换），目前部署在GitHubPages上，国内访问速度还可以，再阅读本文感受来龙去脉和搭建过程。最近准备自己要写点小项目，当前技术栈是以运维和后端为主，自己要写项目的话还是要会一些前端技术，选择学习国内比较流行......
241128伞阀-流体压力载荷 Fluid Penetration Pressure
1.橡胶块材料（1）Mooney-Rivlin2参数（来源：忘了）：【材料常数C10：1.1e+6Pa 【材料常数C01：1.1e+5Pa 【不可压缩性参数D1：1e-5Pa^-1】（2）（来源：X343-流体渗透压力分析-百度文库）（3）APDLShowcase中采用的橡胶参数【一阶Ogden超弹性模型】摩擦参数为0.1，塑料封盖杨氏模量为171.47MP......
宝塔安装wordpress打不开
当你在宝塔面板上安装了WordPress但无法打开时，可以尝试以下几个步骤来排查和解决问题：检查网站配置确认在宝塔面板中，WordPress站点的配置是否正确，包括域名、端口等信息。检查站点的伪静态设置是否已开启，对于WordPress，通常需要启用伪静态规则。检查数据库连接确保WordPr......
DevExpress WinForms中文教程：Data Grid - 如何完成列调整？
DevExpressWinForms拥有180+组件和UI库，能为WindowsForms平台创建具有影响力的业务解决方案。DevExpressWinForms能完美构建流畅、美观且易于使用的应用程序，无论是Office风格的界面，还是分析处理大批量的业务数据，它都能轻松胜任！本文主要介绍如何使用DevExpressWinForms的DataG......
DevExpress WinForms v24.2新功能预览 - 报表查看器和设计器全新升级
DevExpressWinForms 拥有180+组件和UI库，能为WindowsForms平台创建具有影响力的业务解决方案。DevExpressWinForms能完美构建流畅、美观且易于使用的应用程序，无论是Office风格的界面，还是分析处理大批量的业务数据，它都能轻松胜任！获取DevExpressWinFormsv24.1正式版下载DevEx......
stopPropagation()和preventDefault()这两个方法有什么区别？
stopPropagation()和preventDefault()是JavaScript中用于事件处理的两个重要方法，它们的主要区别在于它们针对事件的不同方面：stopPropagation()阻止事件冒泡:当一个元素上的事件被触发时，例如点击一个按钮，该事件会沿着DOM树向上冒泡，触发其父元素、祖先元素上的相同事件......

从零开始的 CPT (Continual Pre-Training): 摆脱复杂的训练框架

相关文章

赞助商

阅读排行