首页 > 其他分享 >书生开源大模型训练营-第4讲-笔记

书生开源大模型训练营-第4讲-笔记

时间:2024-02-17 09:00:26浏览次数:29  
标签:训练营 微调 书生 开源 指令 显卡 语料 模型

1、FineTune简介

1.1、为什么要微调?大语言模型有各行各业的通用知识,但具体深入到某个领域,模型表现不尽如人意,需要微调

1.2、两种微调:增量预训练和指令微调

1.4、增量预训练:给模型投喂额外的特定领域的知识语料,模型在新的语料上继续学习训练。

1.5、指令微调:基座模型学习到到是在须训练数据集上的一个语言分布,本不能理解问题的意图。所以需要有一些方法让基座模型理解人类的意图(指令),这种方法叫指令微调。

1.6、如何进行指令微调:使用指令微调模板,其中有三个角色,System、User和Asistant。在System中设置具体领域的背景信息和意图,User中设置需要回答的问题,Asistant中设置期望的答案。有很多指令微调的框架,可以简化我们的工作,XTuner就是其中之一。

1.7、不同的开源框架有不同的微调框架。Llama和InternLM的格式有些不同。但都能在预测阶段自动的模板组装都是有微调框架完成的。

1.8、指令微调时,需要准备输入输出数据,但只对输出数据/label计算损失。

1.9、增量预训练:和指令微调的一问一答的训练语料不一样,增量预训练只有答案,或者说只有陈述句。所以在语料编写时,System和User部分都设置为空。但计算损失时,和指令微调是一样的。

1.10、XTuner中使用的是LoRA和QLoRA

LLM中线下全连接层有大量的参数,如果全都要进行微调,将需要很大的显存和工作量,为了节省显存和计算量,可以搞一个旁路,以小的参数量来近似达成全量调整的效果。这个旁路由两个变换矩阵构成。

1.11、全量调整、LORA、QLORA的对比

 

 

2、XTuner介绍

1、XTuner:开源微调框架,支撑HuggingFace和ModelScope和多个开源大模型家族,包括Llama、通义千问、ChatGLM以及InternLM;支撑多种GPU显卡,包括消费级显卡和数据中心级显卡

3、8G显卡玩转LLM

4、实战

标签:训练营,微调,书生,开源,指令,显卡,语料,模型
From: https://www.cnblogs.com/littlesuccess/p/18017568

相关文章

  • 书生开源大模型训练营-第3讲-笔记
    1、大模型的局限性a、知识只能截止到训练时间;b、垂直领域的专业能力有限;c、训练成本高,定制化成本高; 2、解决大模型局限性的两种思路RAGVSFTRAG:外挂一个知识库,通过检索得到文档,再将检索到文档和问题一起输入给大模型来生成答案。优点:成本极低、知识可更新;缺点:受限于基座大......
  • 开源免费的专注于建立大型个人知识库推荐-Trilium Notes
        TriliumNotes是一个分层的笔记应用程序,专注于建立大型个人知识库。支持相当丰富的markdown,包括mermaid和latex,而且即时渲染,和typora一样。支持代码类型的笔记,有高亮。 Trilium与其说是笔记软件,不如说是个人wiki。个人知识数据库、收藏夹、代码块、手账、思......
  • dlt开源数据加载工具
    dlt是一个开源数据加载工具,基于python开发特点一个库 dlt就是一个python包,其他地方需要我们自己开发非黑盒系统 我们可以基于代码灵活的进行自定义开发基于乘法的玩法,而不是加法自动代码生成 包含了类似dbt的一些处理cli基于python的玩法 dlt对于数据的处理是基于......
  • Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
    2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型,只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月,已经有了一个用于时间序列预测的开源......
  • 代码随想录算法训练营第十七天| 110.平衡二叉树 257. 二叉树的所有路径 404.左叶
    110.平衡二叉树 题目链接:110.平衡二叉树-力扣(LeetCode)思路:判断平衡二叉树,就是判断两个子树的高度差,继而问题转化为了如何求子树的高度——后序遍历(主要卡在了这里)。递归函数返回的是树的高度,同时用-1来表示退出递归(一开始想着用bool型作为返回值,发现函数不好设计)。同时要关......
  • 开源.NetCore通用工具库Xmtool使用连载 - OSS文件上传篇
    【Github源码】《上一篇》介绍了Xmtool工具库中的图像处理类库,今天我们继续为大家介绍其中的OSS文件上传类库。将本地文件上传到服务器是软件系统经常会遇到的需求,例如:设置用户头像,上传Excel报表等等;涉及到网络访问性能、存储空间等因素的考虑,通常我们会选择使用第三方的对象......
  • 书生开源大模型训练营-第2讲笔记
    1大模型及InternLM模型简介1.1什么是大模型?大模型=大语料+大算力+大模型参数大模型的优势在于其能够捕捉和理解数据中更为复杂、抽象的特征和关系。书读三遍,其义自见大模型的应用和发展也需要在性能、成本和道德等多个方面进行权衡和考量。1.2InternLM模型全链条开源I......
  • 【C#】【WPF】WPF开源控件库HandyControl应用
    1、首先使用nuget包管理器下载handycontrol 2、app.xaml里面引用,这样可以使用里面的样式<Applicationx:Class="HandyControlTest.App"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microso......
  • 借助 .NET 开源库 Sdcb.DashScope 调用阿里云灵积通义千问 API
    在昨天的博文中,我们通过SemanticKernel调用了自己部署的通义千问开源大模型,但是自己部署通义千问对服务器的配置要求很高,即使使用抢占式按量实例,每次使用时启动服务器,使用完关闭服务器,也比较麻烦,而且越高级的大模型对服务器的配置越高。所以昨天的博文中使用了很低级的Qwen-7B......
  • 初步体验通过 Semantic Kernel 与自己部署的通义千问开源大模型进行对话
    春节之前被SemanticKernel所吸引,开始了解它,学习它。在写这篇博文之前读了一些英文博文,顺便在这里分享一下:IntrotoSemanticKernel–PartOneIntrotoSemanticKernel–PartTwoBuildacustomCopilotexperiencewithyourprivatedatausingandKernelMemory......