首页 > 系统相关 >从16-bit 到 1.58-bit :大模型内存效率和准确性之间的最佳权衡

从16-bit 到 1.58-bit :大模型内存效率和准确性之间的最佳权衡

时间:2024-03-11 11:11:06浏览次数:70  
标签:LLM 16 模型 llm 量化 bit 1.58

通过量化可以减少大型语言模型的大小,但是量化是不准确的,因为它在过程中丢失了信息。通常较大的llm可以在精度损失很小的情况下量化到较低的精度,而较小的llm则很难精确量化。

什么时候使用一个小的LLM比量化一个大的LLM更好?

在本文中,我们将通过使用GPTQ对Mistral 7B、Llama 27b和Llama 13B进行8位、4位、3位和2位量化实验来回答这个问题。我们将使用optimum-benchmark比较它们的内存消耗,并使用LLM Evaluation Harness比较它们的准确性。

在最后我们还要介绍一个大模型的最新研究1.58 Bits,它只用 -1,0,1来保存权重,这样就不会再有浮点数,虽然不是量化的方法,但是这样保存模型的权重应该是模型极限了。

llm的核心是深度学习模型,本质上是深度神经网络。这些网络由多层神经元组成,深度堆叠在一起处理和解释大量数据。

这些网络的运作取决于一种叫做“权重”的东西。这些权重在训练过程中进行训练,以类似于矩阵乘法的方式进行相乘。

https://avoid.overfit.cn/post/9a067e1d895240e9a82827edab45549f

标签:LLM,16,模型,llm,量化,bit,1.58
From: https://www.cnblogs.com/deephub/p/18065670

相关文章

  • VK1650是LED数显/数码管显示驱动控制电路(IC),8*4共阴/4*8共阳
    概述VK1650是一种带键盘扫描电路接口的LED驱动控制专用芯片,内部集成有数据锁存器、LED驱动、键盘扫描等电路。SEG脚接LED阳极,GRID脚接LED阴极,可支持8SEGx4GRID的点阵LED显示。最大支持7x4按键。本芯片性能稳定质量可靠,抗干扰能力强,适用于24小时长期连续工作的引用场合。采用S......
  • Unicode、UTF-8、UTF-16
    文章转载自https://zhuanlan.zhihu.com/p/427488961下面两个链接也可以看看https://learn.microsoft.com/en-us/dotnet/standard/base-types/character-encoding-introductionhttps://symbl.cc/en/unicode/table/#hangul-syllables<imgsrc="https://pic3.zhimg.com/v2-7bf25......
  • Atomic Habits
    from「TheSurprisingPowerofAtomicHabits」良い習慣も、悪い習慣も、時間に従って、倍の効果にできる1.1の365乗は37.780.99の365乗は00.03良い習慣を努力して続く間、linearな成果を見たいが、よくあるのは、見えない。そのため、失望になりやすい事実は、「"cr......
  • Acwing166 数独题解 - DFS剪枝优化
    166.数独-AcWing题库题意数独是一种传统益智游戏,你需要把一个9×9的数独补充完整,使得数独中每行、每列、每个3×3的九宫格内数字1∼9均恰好出现一次。请编写一个程序填写数独。思路搜索+剪枝(优化搜索顺序、位运算)优化搜索顺序:很明显,我们肯定是从当前能填合法......
  • 第16章_变量、流程控制与游标
    第16章_变量、流程控制与游标讲师:尚硅谷-宋红康(江湖人称:康师傅)官网:http://www.atguigu.com1.变量在MySQL数据库的存储过程和函数中,可以使用变量来存储查询或计算的中间结果数据,或者输出最终的结果数据。在MySQL数据库中,变量分为系统变量以及用户自定义变量。1.1系统变......
  • 3416:【例72.1】 二进制转化为十进制
    3416:【例72.1】二进制转化为十进制时间限制:1000ms内存限制:65536KB提交数:544通过数:318【题目描述】把一个二进制数转化为十进制数。【输入】第一行一个正整数n(1≤n≤30),表示二进制数的长度。第二行一个二进制数。【输出】输出一个整数,表示对应......
  • abc160E 吃苹果能得到的最大美味度
    有A个红苹果,美味度分别为p[i];有B个青苹果,美味度分别为q[i];另外还有C个无色苹果,美味度分别为r[i],无色苹果在吃之前可以涂成红色或青色。现在要吃X个红苹果和Y个青苹果,求能吃到的最大美味度。1<=X<=A<=1E5;1<=Y<=B<=1E5;1<=C<=1E5;1<=p[i],q[i],r[i]<=1E9反悔贪心,先不考虑无色......
  • 162. 寻找峰值
    162.寻找峰值 https://leetcode.cn/problems/find-peak-element/description/ 思路https://leetcode.cn/problems/find-peak-element/solutions/998152/xun-zhao-feng-zhi-by-leetcode-solution-96sj/ Code二分查找法。需要对两个端点做特殊处理。classSolution......
  • abc161D 第k个轮数
    题面:一个正整数,如果其10进制表示中相邻各位数之差的绝对值不超过1,则称为轮数。求第k小的轮数。范围:k<=1E5思路:数据范围较小,直接bfs。#include<bits/stdc++.h>usingnamespacestd;#defineintlonglong#definerep(i,a,b)for(inti=a;i<=b;i++)#defineper(i,a,b)for......
  • 下载Office 2016 PC版 办公软件
    Office2016专业增强版是微软公司推出的一款办公软件套装,专为满足中小型企业和个人用户的多样化需求而设计。它包含了以下应用程序:Word:用于创建和编辑文档Excel:用于创建和编辑电子表格PowerPoint:用于创建和编辑演示文稿Outlook:用于管理电子邮件、日历和联系人Publisher:用......