人工智能大语言模型起源篇，低秩微调（LoRA）

时间：2024-12-15 10:43:52浏览次数：7

上一篇: 《规模法则（Scaling Law）与参数效率的提高》

序言：您在找工作时会不会经常听到LoRA微调，这项技术的来源就是这里了。

（12）Hu、Shen、Wallis、Allen-Zhu、Li、L Wang、S Wang 和 Chen 于2021年发表的《LoRA: Low-Rank Adaptation of Large Language Models》，https://arxiv.org/abs/2106.09685

现代的大型语言模型在大数据集上进行预训练后，展现了突现能力，并且在多种任务中表现优异，包括语言翻译、总结、编程和问答。然而，如果我们希望提升变换器在特定领域数据和专业任务上的能力，微调变换器是非常值得的。

低秩适配（LoRA）是微调大型语言模型的一种非常有影响力的方法，它具有参数高效的特点。虽然还有其他一些参数高效的微调方法（见下文的综述），但LoRA特别值得一提，因为它既优雅又非常通用，可以应用于其他类型的模型。

虽然预训练模型的权重在预训练任务上是全秩的，但LoRA的作者指出，当预训练的大型语言模型适配到新任务时，它们具有低“内在维度”。因此，LoRA的核心思想是将权重变化（ΔW）分解成低秩表示，这样可以更高效地使用参数。

                                  LoRA 的示例及其性能来自 https://arxiv.org/abs/2106.09685。

（13）Lialin、Deshpande 和 Rumshisky 于2022年发表的《Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning》，https://arxiv.org/abs/2303.15647

现代的大型语言模型在大数据集上进行预训练后，展现了突现能力，并且在多种任务中表现优异，包括语言翻译、总结、编程和问答。然而，如果我们希望提升变换器在特定领域数据和专业任务上的能力，微调变换器是非常值得的。本文综述了40多篇关于参数高效微调方法的论文（包括前缀调优、适配器、低秩适配等流行技术），旨在使微调过程（变得）更加高效，尤其是在计算上。

来源：https://arxiv.org/abs/2303.15647

标签：微调,语言,人工智能,模型,arxiv,abs,LoRA
From： https://www.cnblogs.com/jellyai/p/18607741

学大模型必看！手把手带你从零微调大模型！
前言今天分享一篇技术文章，你可能听说过很多大模型的知识，但却从未亲自使用或微调过大模型。今天这篇文章，就手把手带你从零微调一个大模型。大模型微调本身是一件非常复杂且技术难度很高的任务，因此本篇文章仅从零开始，手把手带你走一遍微调大模型的过程，并不会涉及过多技术细......
使用LLaMA-Factory对LLM大模型进行微调！训练专属于你的模型！
前言如今也是出现了各种各样的大模型，如果想要针对性的让他扮演某个角色我们通常采用的是给他输入prompt（提示词）。但是如果遇到一些"思想钢印"较深的大模型，使用提示词洗脑可能效果并不好。那我们有没有其他方法来解决这个问题？当然有，那就是自行微调一个大模型！本篇文章，就带......
人工智能大语言模型起源篇（二），从通用语言微调到驾驭LLM
上一篇：《人工智能大语言模型起源篇（一），从哪里开始》（5）Howard和Ruder于2018年发表的《UniversalLanguageModelFine-tuningforTextClassification》，https://arxiv.org/abs/1801.06146这篇论文从历史的角度来看非常有意思。尽管它是在原始的《AttentionIsAllYouNeed......
数据科学、数据分析、人工智能必备知识汇总-----多元函数微分学-----持续更新
数据科学、数据分析、人工智能必备知识汇总-----主目录-----持续更新(进不去说明我没写完)：https://blog.csdn.net/grd_java/article/details/140174015文章目录1.偏导数2.高阶偏导数3.梯度4.雅可比矩阵5.Hessian矩阵6.极值判别法则1.偏导数之前讲的导数，是......
人工智能作业:巧用深度学习分类猫狗图像
自然语言处理作业：深入浅出，巧用深度学习分类猫狗图像资源概览助力你在自然语言处理的第一项作业中实现猫狗图像分类，让你深入领悟深度学习模型的奥秘。资源详情代码模块：本资源包含使用DNN、RNN和CNN模型构建猫狗图像分类任务的代码。数据集：请自行获取用于此任务的图......
大小球你所不知道的预测方法：人工智能扫盘预测
一、引言在竞技体育领域，预测比赛结果一直是众多球迷和分析师关注的焦点。本文将探讨一种基于人工智能（AI）的扫盘预测方法，该方法结合了深度学习、概率论和统计学原理，旨在为专业编程师和体育爱好者提供一种新颖的预测视角。以下内容将详细介绍算法原理、模型构建及预测过程。二......
人工智能讲师叶梓老师分享简单好用制作专属数字人的方法
只需一张照片就能让照片里的人开口说话、动起来！想要您的数字人分身吗？今天我要带你一起探索如何用D-IDAI平台，让你的照片“活”起来。首先，到D-ID的网站注册登录，然后点击“创作视频”。接下来上传你的照片，记得，照片要清晰，最好是正面照，这样你的数字人看起来才会更逼真。上传......
人工智能大语言模型起源篇（二），从通用语言微调到驾驭LLM
上一篇：《人工智能大语言模型起源篇（一），从哪里开始》（5）Howard和Ruder于2018年发表的《UniversalLanguageModelFine-tuningforTextClassification》，https://arxiv.org/abs/1801.06146这篇论文从历史的角度来看非常有意思。尽管它是在原始的《AttentionIsAllYouNeed》变......
计算机毕业设计Python+知识图谱大模型AI医疗问答系统健康膳食推荐系统食谱推荐系统
温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO......
计算机毕业设计Python+知识图谱大模型AI医疗问答系统健康膳食推荐系统食谱推荐系统
温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO......

人工智能大语言模型起源篇，低秩微调（LoRA）

相关文章

赞助商

阅读排行