书生开源大模型训练营-第4讲-笔记

时间：2024-02-17 09:00:26浏览次数：35

1、FineTune简介

1.1、为什么要微调？大语言模型有各行各业的通用知识，但具体深入到某个领域，模型表现不尽如人意，需要微调

1.2、两种微调：增量预训练和指令微调

1.4、增量预训练：给模型投喂额外的特定领域的知识语料，模型在新的语料上继续学习训练。

1.5、指令微调：基座模型学习到到是在须训练数据集上的一个语言分布，本不能理解问题的意图。所以需要有一些方法让基座模型理解人类的意图(指令)，这种方法叫指令微调。

1.6、如何进行指令微调：使用指令微调模板，其中有三个角色，System、User和Asistant。在System中设置具体领域的背景信息和意图，User中设置需要回答的问题，Asistant中设置期望的答案。有很多指令微调的框架，可以简化我们的工作，XTuner就是其中之一。

1.7、不同的开源框架有不同的微调框架。Llama和InternLM的格式有些不同。但都能在预测阶段自动的模板组装都是有微调框架完成的。

1.8、指令微调时，需要准备输入输出数据，但只对输出数据/label计算损失。

1.9、增量预训练：和指令微调的一问一答的训练语料不一样，增量预训练只有答案，或者说只有陈述句。所以在语料编写时，System和User部分都设置为空。但计算损失时，和指令微调是一样的。

1.10、XTuner中使用的是LoRA和QLoRA

LLM中线下全连接层有大量的参数，如果全都要进行微调，将需要很大的显存和工作量，为了节省显存和计算量，可以搞一个旁路，以小的参数量来近似达成全量调整的效果。这个旁路由两个变换矩阵构成。

1.11、全量调整、LORA、QLORA的对比

2、XTuner介绍

1、XTuner：开源微调框架，支撑HuggingFace和ModelScope和多个开源大模型家族，包括Llama、通义千问、ChatGLM以及InternLM；支撑多种GPU显卡，包括消费级显卡和数据中心级显卡

3、8G显卡玩转LLM

4、实战

标签：训练营,微调,书生,开源,指令,显卡,语料,模型
From： https://www.cnblogs.com/littlesuccess/p/18017568

书生开源大模型训练营-第3讲-笔记
1、大模型的局限性a、知识只能截止到训练时间；b、垂直领域的专业能力有限；c、训练成本高，定制化成本高； 2、解决大模型局限性的两种思路RAGVSFTRAG：外挂一个知识库，通过检索得到文档，再将检索到文档和问题一起输入给大模型来生成答案。优点：成本极低、知识可更新；缺点：受限于基座大......
开源免费的专注于建立大型个人知识库推荐-Trilium Notes
TriliumNotes是一个分层的笔记应用程序，专注于建立大型个人知识库。支持相当丰富的markdown，包括mermaid和latex，而且即时渲染，和typora一样。支持代码类型的笔记，有高亮。 Trilium与其说是笔记软件，不如说是个人wiki。个人知识数据库、收藏夹、代码块、手账、思......
dlt开源数据加载工具
dlt是一个开源数据加载工具，基于python开发特点一个库 dlt就是一个python包，其他地方需要我们自己开发非黑盒系统我们可以基于代码灵活的进行自定义开发基于乘法的玩法，而不是加法自动代码生成包含了类似dbt的一些处理cli基于python的玩法 dlt对于数据的处理是基于......
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源......
代码随想录算法训练营第十七天| 110.平衡二叉树 257. 二叉树的所有路径 404.左叶
110.平衡二叉树题目链接：110.平衡二叉树-力扣（LeetCode）思路：判断平衡二叉树，就是判断两个子树的高度差，继而问题转化为了如何求子树的高度——后序遍历（主要卡在了这里)。递归函数返回的是树的高度，同时用-1来表示退出递归（一开始想着用bool型作为返回值，发现函数不好设计）。同时要关......
开源.NetCore通用工具库Xmtool使用连载 - OSS文件上传篇
【Github源码】《上一篇》介绍了Xmtool工具库中的图像处理类库，今天我们继续为大家介绍其中的OSS文件上传类库。将本地文件上传到服务器是软件系统经常会遇到的需求，例如：设置用户头像，上传Excel报表等等；涉及到网络访问性能、存储空间等因素的考虑，通常我们会选择使用第三方的对象......
书生开源大模型训练营-第2讲笔记
1大模型及InternLM模型简介1.1什么是大模型？大模型=大语料+大算力+大模型参数大模型的优势在于其能够捕捉和理解数据中更为复杂、抽象的特征和关系。书读三遍，其义自见大模型的应用和发展也需要在性能、成本和道德等多个方面进行权衡和考量。1.2InternLM模型全链条开源I......
【C#】【WPF】WPF开源控件库HandyControl应用
1、首先使用nuget包管理器下载handycontrol 2、app.xaml里面引用，这样可以使用里面的样式<Applicationx:Class="HandyControlTest.App"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microso......
借助 .NET 开源库 Sdcb.DashScope 调用阿里云灵积通义千问 API
在昨天的博文中，我们通过SemanticKernel调用了自己部署的通义千问开源大模型，但是自己部署通义千问对服务器的配置要求很高，即使使用抢占式按量实例，每次使用时启动服务器，使用完关闭服务器，也比较麻烦，而且越高级的大模型对服务器的配置越高。所以昨天的博文中使用了很低级的Qwen-7B......
初步体验通过 Semantic Kernel 与自己部署的通义千问开源大模型进行对话
春节之前被SemanticKernel所吸引，开始了解它，学习它。在写这篇博文之前读了一些英文博文，顺便在这里分享一下：IntrotoSemanticKernel–PartOneIntrotoSemanticKernel–PartTwoBuildacustomCopilotexperiencewithyourprivatedatausingandKernelMemory......

书生开源大模型训练营-第4讲-笔记

相关文章

赞助商

阅读排行