首页 > 其他分享 >xtuner微调大模型笔记

xtuner微调大模型笔记

时间:2024-01-24 10:32:38浏览次数:35  
标签:改动 超大 微调 玩具 xtuner 笔记 LoRA 模型

微调原理

想象一下,你有一个超大的玩具,现在你想改造这个超大的玩具。但是,对整个玩具进行全面的改动会非常昂贵

※ 因此,你找到了一种叫 LoRA 的方法:只对玩具中的某些零件进行改动,而不是对整个玩具进行全面改动

※ 而 QLoRA 是 LoRA 的一种改进:如果你手里只有一把生锈的螺丝刀,也能改造你的玩具。

微调过后得到的文件将 HuggingFace adapter 合并到大语言模型:

xtuner微调大模型笔记_语言模型

部署过程中出现问题

xtuner微调大模型笔记_语言模型_02

没有切换commit版本,导致部署出错

最后结果

xtuner微调大模型笔记_语言模型_03

标签:改动,超大,微调,玩具,xtuner,笔记,LoRA,模型
From: https://blog.51cto.com/u_16507376/9392123

相关文章

  • xtuner微调大模型作业
    ......
  • 2024/1/23 算法笔记
    1.负进制数[P1017NOIP2000提高组]进制转换-洛谷|计算机科学教育新生态(luogu.com.cn)所谓负进制数,就是进制数为负数的一种实数表示法。例如,-15(十进制)相当于110001(-2进制),并且它可以被表示为2的幂级数的和数:110001=1(-2)5+1*(-2)4+0(-2)3+0*(-2)2+0(-2)^1+1(-2)......
  • 大三寒假学习进度笔记14
    今天在编写项目时了解到了PyTorch3D这个库,因此对这个库进行了一定的了解并尝试使用这个库PyTorch3D旨在与深度学习方法稳定集成,以预测和处理3D数据。在进行安装PyTorch3D时产生了很多错误。在anaconda虚拟环境使用condainstall下载PyTorch3D时总是会卡在solvingenvironment这......
  • 卷积神经网络学习笔记
    全连接神经网络的结构全连接神经网络的整体结构可以简化为智能函数\(y=f_θ(x)\)输入和输出层一般为数据矩阵全连接网络的单元结构神经网络的思路:从单元到整体一个单元的结构:\(X_1,X_2,X_3...\)是很多矩阵,然后这些矩阵分别乘上对应的权重矩阵,再加上偏置矩阵b,输......
  • Binary tree traversal-- beadth-first and depth-first【1月23日学习笔记】
    点击查看代码//Binarytreetraversal--beadth-firstanddepth-first#include<iostream>#include<queue>//STLusingnamespacestd;structnode{intdata;node*left,*right;};node*getnewnode(intx){node*temp=newnode;temp-&......
  • 大模型笔记6
    今天学习的内容是大模型评测,是针对具有标准答案的客观问题,我们可以我们可以通过使用定量指标比较模型的输出与标准答案的差异,并根据结果衡量模型的性能。同时,由于大语言模型输出自由度较高,在评测阶段,我们需要对其输入和输出作一定的规范和设计,尽可能减少噪声输出在评测阶段的影响,才......
  • C#学习笔记-类、对象、类成员
    类(class)  在类与名称空间简单学习了类的概念。程序世界中的类是对现实世界的事物进行抽象的结果,类定义了事物的特点、行为,在一定程度上反映现实事物的样子。但类又舍弃了一些不必要的内容(在程序中没有涉及),是现实事物的模型。建模是一个由表及里的过程,向外提供了易于使用的接口,......
  • Binary tree traversal-- level-order traversal using queue【1月23日学习笔记】
    点击查看代码//Binarytreetraversal--level-ordertraversalusingqueue#include<iostream>#include<queue>//STLusingnamespacestd;structnode{intdata;node*left,*right;};node*getnewnode(intx){node*temp=newnode;t......
  • 《人月神话》前十章阅读笔记
     首先,《人月神话》这本书从编程的乐趣入手认为这种快乐是一种创建事物的纯粹快乐,这种快乐来自于开发对他人有用的东西。,快乐来自于整个过程体现出的一股强大的魅力,这种快乐是持续学习的快乐,这种快乐还来自于在易于驾驭的介质上工作但同时没有一份职业仅仅包含乐趣,这份职业的苦恼......
  • 哈希学习笔记+杂题(进阶1 字符串哈希)
    哈希杂题前言:竟然下雪了,但是天是灰蒙蒙的。一、哈希学习笔记+杂题(进阶1字符串哈希)相关题单:戳我字符串哈希因为是一种玄学做法,所以具有极强的延展性。所以再碰到字符串的题时,抛开马拉车,kmp,字典树,AC自动机,SA&SAM,先想一下哈希的做法,如果时间复杂度允许,那就可以直接上哈希(虽然你......