首页 > 其他分享 >大模型知识点

大模型知识点

时间:2023-05-17 17:56:04浏览次数:28  
标签:知识点 模型 微调 矩阵 旁路 参数 LoRA

参数有效化微调(Parameter Efficient Fine Tuning,PEFT)

参数有效化微调大致可以分为三个方法:Adapter、Prompt、LoRA

 

LORA:

LoRA的思想也很简单,在自注意力层的四个权重矩阵Wq, Wk, Wv, Wo的所有或者部分旁边增加一个旁路(如文中表示在GPT3上只有Wq和Wv加了旁路),做一个降维再升维的操作,来模拟所谓的 intrinsic rank(文中表示把LoRA应用在前馈神经网络层或者RNN等结构的研究留给后续研究工作) 。训练的时候固定PLM的参数,只训练降维矩阵A与升维矩阵B。而模型的输入输出维度不变,输出时将BA与PLM的输出叠加。用随机高斯分布初始化A,用0矩阵初始化B,保证训练的开始此旁路矩阵依然是0矩阵。这种思想有点类似于残差连接,同时使用这个旁路的更新来模拟full fine-tuning的过程。并且,full fine-tuning可以被看做是LoRA的特例(当r等于k时)。实验结果表明基于LoRA的方法效果不亚于甚至能超过微调。

总结,基于大模型的内在低秩特性,增加旁路矩阵来模拟全模型参数微调,LoRA通过简单有效的方案来达成轻量微调的目的。GPT的本质是对训练数据的有效压缩,从而发现数据内部的逻辑与联系,LoRA的思想与之有相通之处,原模型虽大,但起核心作用的参数是低秩的,通过增加旁路,达到四两拨千斤的效果。

标签:知识点,模型,微调,矩阵,旁路,参数,LoRA
From: https://www.cnblogs.com/qiaoqifa/p/17409548.html

相关文章

  • 考虑柔性负荷的综合能源低碳经济调度 调度模型参考第
    考虑柔性负荷的综合能源低碳经济调度调度模型参考第一篇文献碳交易模型参考第二篇考虑三种场景并用cplex求解场景一调度结果如图所示本代码可改写能力强ID:49150696224502280......
  • 基于转子磁链定向的异步电机矢量控制系统仿真模型 转速在2
    基于转子磁链定向的异步电机矢量控制系统仿真模型转速在2秒由500变为1400,3秒由空载变为额定负载的图如下。转速可调。ID:88160676868051065......
  • 动手学深度学习(十) NLP 语言模型与数据集
    语言模型一段自然语言文本可以看作是一个离散时间序列,给定一个长度为的词的序列,语言模型的目标就是评估该序列是否合理,即计算该序列的概率:本节我们介绍基于统计的语言模型,主要是元语法(-gram)。在后续内容中,我们将会介绍基于神经网络的语言模型。语言模型假设序列中的每个词是依次生......
  • 基于前景和背景的图像分割,流行排序模型 MATLAB代码 将图像像素
    基于前景和背景的图像分割,流行排序模型MATLAB代码将图像像素分为前景类和背景类。基于图的流形排序模型的交互式图像分割框架,该模型是一种基于图的半监督学习技术,可以根据输入数据显示的内在结构学习非常光滑的函数。通过克服传统模型中图构造的两个核心问题:图的结构和图的边缘权......
  • 三相级联H桥逆变器仿真模型,七电平,十一电平逆变器,采用载波移相或者载波层叠的控制方法,
    三相级联H桥逆变器仿真模型,七电平,十一电平逆变器,采用载波移相或者载波层叠的控制方法,可以提供参考文献ID:6430694665023809......
  • 三相逆变器双闭环控制MATLAB/Simulink模型,外环采用PR控制,内环采用比例控制。
    三相逆变器双闭环控制MATLAB/Simulink模型,外环采用PR控制,内环采用比例控制。包含仿真模型,参考文献及设计报告,设计报告中总结了逆变器的建模和PR控制的原理,推荐初学者参考。参数整定采用matlab的.m文件。ID:7420692918210168......
  • 三相四桥臂逆变器MATLAB/Simulink仿真模型,接不平衡负载时的调制算法。
    三相四桥臂逆变器MATLAB/Simulink仿真模型,接不平衡负载时的调制算法。接非线性负载时的多PR控制器并联算法。提供仿真模型、参考文献ID:9835693184071748......
  • 基于模型过程中的特征选择
    特征选择的常用方法过滤法按照发散性或者相关性对各个特征进行评分,通过设定阈值或者待选择阈值的个数来选择特征。包装法根据目标函数(通常是预测效果评分)每次选择若干特征,或者排除若干特征。嵌入法使用机器学习的某些算法或模型进行训练,得到各个特征的权值系数,并根据系数从......
  • GPT大语言模型Alpaca-lora本地化部署实践【大语言模型实践一】
    模型介绍Alpaca模型是斯坦福大学研发的LLM(LargeLanguageModel,大语言)开源模型,是一个在52K指令上从LLaMA7B(Meta公司开源的7B)模型微调而来,具有70亿的模型参数(模型参数越大,模型的推理能力越强,当然随之训练模型的成本也就越高)。LoRA,英文全称Low-RankAdaptationofLargeLanguage......
  • blender 3D 汽车模型下载
    前言因为之前需要模拟摄像头拍摄汽车车牌,从各种途径下载了一些blender3D汽车模型,现将模型分享出来,如有需要,直接去最后面下载地址下载即可目前已经车型40多款车型图70年代Porsche911汽车2010Jeep牧马人吉普车2017奥迪AudiR8V10Plus跑车2017款福特F450皮卡车2019......