从16-bit 到 1.58-bit ：大模型内存效率和准确性之间的最佳权衡

时间：2024-03-11 11:11:06浏览次数：78

标签：LLM 16 模型 llm 量化 bit 1.58

通过量化可以减少大型语言模型的大小，但是量化是不准确的，因为它在过程中丢失了信息。通常较大的llm可以在精度损失很小的情况下量化到较低的精度，而较小的llm则很难精确量化。

什么时候使用一个小的LLM比量化一个大的LLM更好?

在本文中，我们将通过使用GPTQ对Mistral 7B、Llama 27b和Llama 13B进行8位、4位、3位和2位量化实验来回答这个问题。我们将使用optimum-benchmark比较它们的内存消耗，并使用LLM Evaluation Harness比较它们的准确性。

在最后我们还要介绍一个大模型的最新研究1.58 Bits，它只用 -1，0，1来保存权重，这样就不会再有浮点数，虽然不是量化的方法，但是这样保存模型的权重应该是模型极限了。

llm的核心是深度学习模型，本质上是深度神经网络。这些网络由多层神经元组成，深度堆叠在一起处理和解释大量数据。

这些网络的运作取决于一种叫做“权重”的东西。这些权重在训练过程中进行训练，以类似于矩阵乘法的方式进行相乘。

https://avoid.overfit.cn/post/9a067e1d895240e9a82827edab45549f

标签：LLM,16,模型,llm,量化,bit,1.58
From： https://www.cnblogs.com/deephub/p/18065670

VK1650是LED数显/数码管显示驱动控制电路（IC），8*4共阴/4*8共阳
概述VK1650是一种带键盘扫描电路接口的LED驱动控制专用芯片，内部集成有数据锁存器、LED驱动、键盘扫描等电路。SEG脚接LED阳极，GRID脚接LED阴极，可支持8SEGx4GRID的点阵LED显示。最大支持7x4按键。本芯片性能稳定质量可靠，抗干扰能力强，适用于24小时长期连续工作的引用场合。采用S......
Unicode、UTF-8、UTF-16
文章转载自https://zhuanlan.zhihu.com/p/427488961下面两个链接也可以看看https://learn.microsoft.com/en-us/dotnet/standard/base-types/character-encoding-introductionhttps://symbl.cc/en/unicode/table/#hangul-syllables<imgsrc="https://pic3.zhimg.com/v2-7bf25......
Atomic Habits
from「TheSurprisingPowerofAtomicHabits」良い習慣も、悪い習慣も、時間に従って、倍の効果にできる1.1の365乗は37.780.99の365乗は00.03良い習慣を努力して続く間、linearな成果を見たいが、よくあるのは、見えない。そのため、失望になりやすい事実は、「"cr......
Acwing166 数独题解 - DFS剪枝优化
166.数独-AcWing题库题意数独是一种传统益智游戏，你需要把一个9×9的数独补充完整，使得数独中每行、每列、每个3×3的九宫格内数字1∼9均恰好出现一次。请编写一个程序填写数独。思路搜索+剪枝(优化搜索顺序、位运算)优化搜索顺序:很明显,我们肯定是从当前能填合法......
第16章_变量、流程控制与游标
第16章_变量、流程控制与游标讲师：尚硅谷-宋红康（江湖人称：康师傅）官网：http://www.atguigu.com1.变量在MySQL数据库的存储过程和函数中，可以使用变量来存储查询或计算的中间结果数据，或者输出最终的结果数据。在MySQL数据库中，变量分为系统变量以及用户自定义变量。1.1系统变......
3416：【例72.1】二进制转化为十进制
3416：【例72.1】二进制转化为十进制时间限制:1000ms内存限制:65536KB提交数:544通过数:318【题目描述】把一个二进制数转化为十进制数。【输入】第一行一个正整数n(1≤n≤30)，表示二进制数的长度。第二行一个二进制数。【输出】输出一个整数，表示对应......
abc160E 吃苹果能得到的最大美味度
有A个红苹果，美味度分别为p[i]；有B个青苹果，美味度分别为q[i]；另外还有C个无色苹果，美味度分别为r[i]，无色苹果在吃之前可以涂成红色或青色。现在要吃X个红苹果和Y个青苹果，求能吃到的最大美味度。1<=X<=A<=1E5;1<=Y<=B<=1E5;1<=C<=1E5;1<=p[i],q[i],r[i]<=1E9反悔贪心，先不考虑无色......
162. 寻找峰值
162.寻找峰值 https://leetcode.cn/problems/find-peak-element/description/ 思路https://leetcode.cn/problems/find-peak-element/solutions/998152/xun-zhao-feng-zhi-by-leetcode-solution-96sj/ Code二分查找法。需要对两个端点做特殊处理。classSolution......
abc161D 第k个轮数
题面：一个正整数，如果其10进制表示中相邻各位数之差的绝对值不超过1，则称为轮数。求第k小的轮数。范围：k<=1E5思路：数据范围较小，直接bfs。#include<bits/stdc++.h>usingnamespacestd;#defineintlonglong#definerep(i,a,b)for(inti=a;i<=b;i++)#defineper(i,a,b)for......
下载Office 2016 PC版办公软件
Office2016专业增强版是微软公司推出的一款办公软件套装，专为满足中小型企业和个人用户的多样化需求而设计。它包含了以下应用程序：Word：用于创建和编辑文档Excel：用于创建和编辑电子表格PowerPoint：用于创建和编辑演示文稿Outlook：用于管理电子邮件、日历和联系人Publisher：用......

从16-bit 到 1.58-bit ：大模型内存效率和准确性之间的最佳权衡

相关文章

赞助商

阅读排行