大语言模型---LoRA中损失值的计算

时间：2024-11-22 14:18:25浏览次数：3

文章目录

概要

Llama-7B模型的LoRA微调训练中，通过使用Cross-Entropy Loss来度量模型输出的预测分布和真实标签分布之间的距离，来衡量模型的准确性。本文主要介绍LoRA中损失值的计算流程。
Cross-Entropy Loss作用：是深度学习和机器学习中常用的损失函数之一，主要用于分类任务。

损失计算流程

以下是 LLaMA-7B 模型中损失计算的三个步骤：

计算logits矩阵（生成分数）：
模型最后一层MLP的输出与模型词表权重进行点乘计算生成一个行数（nvocab）为32,000 ，列数（seq）为4096的 logits 矩阵，每个元素对应词汇表中的一个词，表示生成该词的“分数”。
Softmax 转换（分数变概率）：
将 logits 矩阵经过 Softmax 转换为概率分布矩阵 Y ^ ∈
标签：标签,模型,矩阵,损失,---,计算,logits,LoRA
From： https://blog.csdn.net/weixin_43883448/article/details/143972722

网络安全面试题整理 - 甲方类（一）
1.简述一下目前主流编程语言的相关漏洞答：这个题的相关思路就是聊一聊目前主流语言的漏洞，你可以从两个方面进行阐述：Java、Python、PHP（漏洞大户）的相关漏洞，其实也是那几个；聊聊你知道的框架-比如Apache基金会框架、PHPAdmin、Python主流Web架构-jinjia2、Django等；Pyth......
飞凌嵌入式T113-i开发板RISC-V核的实时应用方案
随着市场对嵌入式设备的功能需求越来越高，集成了嵌入式处理器和实时处理器的主控方案日益增多，以便更好地平衡性能与效率——实时核负责高实时性任务，A核处理复杂任务，两核间需实时交换数据。然而在数据传输方面，传统串行接口尽管成本较低，但其传输速率相对较慢；反之，并行接口虽然传输......
项目启动报错java 读取FMavenRepositoryorglz4lz4-java1.7.1lz4-java-1.7.1.jar时出错
文章目录1.错误呈现2.错误原因3.解决方案3.1方案一：删除jar包，让Maven重新下载（项目重启后可能还是会报错）3.2方案二：删除jar包，手动下载jar包1.错误呈现java:读取F:\MavenRepository\org\lz4\lz4-java\1.7.1\lz4-java-1.7.1.jar时出错;errorinopeningzipfil......
JVM 性能调优 -- 线上应用 JVM 内存调优【实战】
前言：上一篇我们分享了线上应用的JVM内存预估技巧，通过对JVM内存的预估来合理的选用服务器资源和应用部署方案，本篇我们来分享引用的JVM调优实例，如何通过JVM调优来降低应用的GC频率。JVM系列文章传送门初识JVM（Java虚拟机）深入理解JVM（Java虚拟机）一文搞懂JVM......
小乔陪玩-全链路情绪价值电商平台
小乔陪玩，一款隶属于红色猎人(四川)信息技术有限公司的创新型全链路情绪价值电商平台。于2024年9月3日正式取得了其标志性的商标“小乔陪玩XiaoQiaoPW”（商标申请号：80717455）。这一里程碑式的进展不仅标志着小乔陪玩在法律层面的正式确立，也预示着其在情绪价值电商领域迈出了坚实的一......
ABP-VNext 用户权限管理系统实战06---多租户集成
一、集成1、引用安装包Volo.Abp.AspNetCore.MultiTenancy2、配置租户keyConfigure<AbpAspNetCoreMultiTenancyOptions>(options=>{options.TenantKey="BridgeTenantKey";});3、在代码中写入所有租户，当在也可以在配置文件或数据库中定义你的所有租户Con......
Linux基础-目录操作与文件操作
学习Linux基础，掌握Linux中比较基础的目录操作与文件操作。目录操作pwd：查看当前目录路径（绝对路径）pwdls：显示指定路径（默认当前的路径）下的文件或者目录ls[选项]-a：显示所有（包含隐藏文件）-l：显示所有文件或目录的详细信息列表-r：将文件以相反的次序显示（原定依照英文字母的次......
Linux基础-用户/用户组操作
用户操作普通用户：安装系统时创建的用户，也可以由管理员来分配。最高管理员：root，Linux系统内置，当第一次使用root用户的时候，需要修改密码。修改最高管理员root用户的密码：sudopasswd关于用户、文件及权限的关系：用户对文件拥有的权限（读、写、执行、无权限）普通用户和最高管......
毕业论文设计 Python实现基于改进的鲸鱼优化算法（IWOA）和门控循环单元（GRU）进行时间序列预
目录Python实现基她改进她鲸鱼优化她法（UZIWOA）和门控循环单元（GTT）进行时间序列预测模型她详细项目实例 2项目背景介绍...2项目目标她意义...2项目目标：...2项目意义：...3项目挑战...3项目特点她创新...3项目应用领域...3项目效果预测图她程序设计...4项......
毕业论文设计 Python 实现基于SSA-CNN-LSTM麻雀算法优化卷积长短期记忆神经网络进行时
目录Python实现基爱她TTA-CNN-LTTM麻雀算法优化卷积长短期记忆神经网络进行时间序列预测模型爱她详细项目实例 4项目背景介绍...4项目目标...5提升预测精度...5实现自动化优化...5提升模型爱她泛化能力...5提高计算效率...5项目意义...5创新算法应用.......

大语言模型---LoRA中损失值的计算

文章目录

概要

损失计算流程

相关文章

赞助商

阅读排行