1 GPU Memory Usage

1.1 How to Compute

How to compute GPU Memory Usage?

Model size:
Model Weights: 4Bytes * num_param
Optimizer: 4Bytes * 2 * num_param (for AdamW)
Gradient: 4Bytes * num_param
feed forward:
sum:

1.2 How to Reduce

Strategy 1:

Optimization Strategy	Optimization Object	Description	Training Time
Baseline	-
+ Gradient Accumulation	Forward propagation value
+ Gradient Checkpoints `Trainer(gradient_checkingpoint = True)`	Forward propagation value	not save the immediate weights and values	take more time -> get less memory
+ Adafactor Optimizer	Optimizer
+ Freeze Model	Forward propagation value / Gradient
+ Data Length	Forward propagation value

Strategy 2: Reduce the number of parameters
PEFT(Prompt Tuning, LoRA...)
Strategy 3: Reduce the number of bytes each parameter occupies
The default precision is single precision, which is represented as fp32, using 32 bits to represent one digit.

Name
Single-precision floating-point format	fp32	4 Bytes	32 bits
Half-precision floating-point format	fp16	2 Bytes	16 bits
Brain floating-point format(BFloat16)	bp16	2 Bytes	16 bits
	int8	1 Bytes	8 bits
	fp4	0.5 Bytes	4 bits
4-bit NormalFloat	nf4	0.5 Bytes	4 bits

2 Precision

02 - Half precision & LLaMA 2
03 - Half precision & ChatGLM 3
04 - 8 Bit
05 - 4 Bit & QLoRA

Reference

手把手带你实战HuggingFace Transformers-实战篇

标签：bf16,propagation,Gradient,Bytes,precision,Quantization,fp4,Forward,bits
From： https://www.cnblogs.com/forhheart/p/18171303

Vinka超低功耗抗干扰LCD液晶段码屏驱动芯片推出新封装：VKL144C/D LQFP48/SSOP48
VKL144C/D概述：VKL144C/D是一个点阵式存储映射的LCD驱动器，可支持最大144点（36SEGx4COM）的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据，可配置4种功耗模式，也可通过关显示和关振荡器进入省电模式。其高抗干扰，低功耗的特性适用于水电气表以及工控仪表类产品。特点•工......
VKL144C/D LQFP48/SSOP48仪器仪表超低功耗/超省电LCD液晶段码驱动IC适用于分贝仪、测
VKL144C/D概述：VKL144C/D是一个点阵式存储映射的LCD驱动器，可支持最大144点（36SEGx4COM）的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据，可配置4种功耗模式，也可通过关显示和关振荡器进入省电模式。其高抗干扰，低功耗的特性适用于水电气表以及工控仪表类产品。特点•工......
VKL144C/D LQFP48/SSOP48仪器仪表超低功耗/超省电LCD液晶段码驱动IC: 分贝仪、测光仪
VKL144C/D概述：VKL144C/D是一个点阵式存储映射的LCD驱动器，可支持最大144点（36SEGx4COM）的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据，可配置4种功耗模式，也可通过关显示和关振荡器进入省电模式。其高抗干扰，低功耗的特性适用于水电气表以及工控仪表类产品。特点•工......
低功耗抗噪/高抗干扰，LCD显示驱动控制电路（IC）-VK2C23A/B LQFP48/64 替代市面上16C23，56*4
VK2C23是一个点阵式存储映射的LCD驱动器，可支持最大224点（56SEGx4COM）或者最大416点（52SEGx8COM）的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据，也可通过指令进入省电模式。其高抗干扰，低功耗的特性适用于水电气表以及工控仪表类产品。L23+01特点：•工作电压2.4-5.5V•内......
详解DROO论文中的order-preserving quantization method(保序量化方法)
一、论文概述1.原文GitHub链接DeepReinforcementLearningforOnlineComputationOffloadinginWirelessPoweredMobile-EdgeComputingNetworks2.原文大意提出了一种深度强化学习方法解决了边缘计算任务卸载决策和资源分配问题。整体分为两大部分：其中第一部......
VKL144A/B TSSOP48/QFP48L-点阵式液晶驱动芯片/低电流LCD驱动，36×4段技术支持
产品品牌：永嘉微电/VINKA产品型号：VKL144A/B封装形式：TSSOP48/QFN48L概述：VKL144A/BTSSOP48/QFN48L是一个点阵式存储映射的LCD驱动器，可支持最大144点（36SEGx4COM）的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据，可配置4种功耗模式，也可通过关显示和关振荡器进入省电模式......
Vector Quantization
VectorQuantizationQuantization(量化)Definition:aprocessofrepresentingalarge–possiblyinfinite–setofvalueswithamuchsmallerset.WidelyUsedinLossyCompressionRepresentcertainimagecomponentswithfewerbits(compression)Withunavoidab......
超低功耗LCD显示段码驱动芯片VKL128 LQFP44 适用于扫地机器人/燃气表-原厂技术支持
VKL128概述:VKL128是一个点阵式存储映射的LCD驱动器，可支持最大128点（32SEGx4COM）的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据，可配置4种功耗模式，也可通过关显示和关振荡器进入省电模式。其高抗干扰，低功耗的特性适用于水电气表以及工控仪表类产品。功能特点:• ......
应用于指纹门锁上的安全芯片ACM32FP421系列，内核性能高，安全性高，内建 AES、CRC、TRNG 等
ACM32FP421芯片的内核基于ARMv8-M架构，支持Cortex-M33和Cortex-M4F指令集。内核支持一整套DSP指令用于数字信号处理，支持单精度FPU处理浮点数据，同时还支持MemoryProtectionUnit（MPU）用于提升应用的安全性。内核性能高于ARMv7-M架构的M4F20%。ACM32FP421系列芯......
QARV: Quantization-Aware ResNet VAE for Lossy Image Compression
目录简介创新之处模型结构实验结果什么是Quantization-Aware量化感知？简介该文章基于VAE提出一种新的有损图像压缩方法，起名叫quantization-awareResNetVAE(QARV).这种方法集成了测试时间量化和量化感知训练，没有它就无法进行熵编码？除此之外还专门设计了用于快速解码的QARV网......

Quantization: fp16, bf16, int8, fp4, nf4

1 GPU Memory Usage

1.1 How to Compute

1.2 How to Reduce

2 Precision

Reference

相关文章

赞助商

阅读排行