What Makes Quantization for Large Language Models Hard？

时间：2024-07-05 13:57:36浏览次数：21

标签：What Language Models 性能透镜 LLM 微扰量化我们

本文是LLM系列文章，针对《What Makes Quantization for Large Language Models Hard?
An Empirical Study from the Lens of Perturbation》的翻译。

是什么让大型语言模型的量化变得困难？微扰透镜的经验研究

摘要
1 引言
2 相关工作
3 前言
4 从微扰的角度看LLM量子化
5 改进LLM量化
6 结论

摘要

量化已经成为一种很有前途的技术，可以提高大型语言模型（LLM）的内存和计算效率。尽管性能和效率之间的权衡是众所周知的，但关于量化和LLM性能之间的关系仍有很多需要了解的地方。为了阐明这种关系，我们提出了一个关于量化的新视角，将其视为添加到LLM的权重和激活中的扰动。我们称这种方法为“微扰透镜”。使用这个透镜，我们对各种人工扰动进行了实验，以探索它们对LLM性能的影响。我们的研究结果揭示了扰动性质和LLM性能之间的几种联系，为均匀量化的失败案例提供了见解，并提出了提高LLM量化稳健性的潜在解决方案。为了证明我们的发现的重要性，我们基于我们的见解实现了一种简单的非均匀量化方法。我们的实验表明，对于权重和激活，这种方法在4位权重量化和8位量化上都实现了最小的性能退化。这些结果验证了我们方法的正确性，并突出了其在不牺牲性能的情况下提高LLM效率的潜力。

1 引言

2 相关工作

3 前言

4 从微扰的角度看LLM量子化

5 改进LLM量化

6 结论

我们的工作引入了一个关于量子化的新视角，我们称之为“微扰透镜”。使用这种方法，我们对LLM的均匀量化进行了全面的研究，评估了不同量化设置下各种模型的性能。我们还研究

标签：What,Language,Models,性能,透镜,LLM,微扰,量化,我们
From： https://blog.csdn.net/c_cpp_csharp/article/details/140187656

Android相关概念 what
AndroidABI不同的Android设备使用不同的CPU，而不同的CPU支持不同的指令集。CPU与指令集的每种组合都有专属的应用二进制接口(ABI)。ABI包含以下信息：可使用的CPU指令集（和扩展指令集）。运行时内存存储和加载的字节顺序。Android始终是little-endian。在应用和系统之......
FOODGPT: A LARGE LANGUAGE MODEL IN FOOD TESTING DOMAIN WITH INCREMENTAL PRE-TRAI
文章目录题目摘要方法题目食品测试的大型语言模型论文地址：https://arxiv.org/abs/2308.10173摘要目前，特定领域的大型语言模型的构建是通过在基础模型上进行微调来完成的。有些模型还包含知识库，无需预先训练。这是因为基础模型在预训练过程中已经包......
django models对应的mysql类型
Django模型字段类型与MySQL数据库类型的对应关系如下：Django模型字段类型MySQL数据库类型AutoFieldBIGINTUNSIGNEDCharFieldVARCHARIntegerFieldINTDecimalFieldDECIMALDateFieldDATEDateTimeFieldDATETIMEFileField,ImageFieldVARCHAR(用于文件路径)BooleanFieldBOOL(如......
In what kind of situations that no pull would be configured as a input gpio
InthecontextofGPIOconfiguration,thechoicebetweenusingapull-up,pull-down,ornopullresistordependsonthespecificrequirementsoftheapplicationandtheexternalcircuitryconnectedtotheGPIOpin.NoPullConfigurationWhenGPIO_InitStru......
5、Django-模型-models
概念：基本模板：模板其实就是我们使用的HTML写好的页面--先在应用的目录下创建模板文件夹templates、然后在templates中创建模板文件、如html--最后在views.py中去渲染模板、使用render函数将模板返回给用户：returnrender(request,'.html') 定义模板：--模板里就是要对......
12、 Django-模型models的基本操作-增删改查
一般的数据库操作流程:1、创建数据库，设计表结构和字段2、连接Mysq1数据库，并编写数据访问层代码3.业务逻辑层去调用数据访问层执行数据库操作Diango通过Mode1操作数据库，不管你数据库的类型是MySql或者Sqlite，Django自动帮你生成相应数据库类型的SQL语句，所以不需要关注SQL语句......
11、 Django-模型基础-models-ORM框架-管理器对象
#概述django根据属性的类型确定以下信息当前选择的数据库支持字段的类型渲染管理表单时使用的默认htm1控件在管理站点最低限度的验证django会为表增加自动增长的主键列，每个模型只能有一个主键列，如果使用选项设置某属性为主键列后则django不会再生成默认的主键列#属性命......
Apple - Core Image Kernel Language Reference
本文翻译整理自：CoreImageKernelLanguageReference（更新日期：2015-01-12https://developer.apple.com/library/archive/documentation/GraphicsImaging/Reference/CIKernelLangRef/Introduction/Introduction.html#//apple_ref/doc/uid/TP40004397-CH1-SW1文章目录一......
ModelScope 模型下载
1、安装依赖pipinstallmodelscope-ihttps://mirrors.aliyun.com/pypi/simple/2、创建一个python脚本#-*-coding:utf-8-*-#@Time:2024/6/24上午10:01#@Author:yangwenjie#@Email:邮箱#@File:modelscope_spdownload.py.py#@Project:studyfroma......
What is the difference between OpenAI and ChatOpenAI in LangChain?
题意：在LangChain中，OpenAI 和 ChatOpenAI 的主要区别是什么？问题背景：IreadtheLangChainQuickstart.Thereisademoinside: 里面有一个演示：fromlangchain.llmsimportOpenAIfromlangchain.chat_modelsimportChatOpenAIllm=OpenAI()chat......