开源大模型占GPU显存计算方法

时间：2024-09-08 22:50:49浏览次数：8

标签：显存 7B 16 模型开源量化 GPU

运行大模型GPU占用计算公式：

\(M=\frac{(P * 4B)}{32 / Q} * 1/2\)

M : 以GB标识的GPU内存
P : 模型中的参数数量，例如一个7B模型有70亿参数
4B : 4个字节，表示用于每个参数的字节
32 : 4个字节中有32位
Q : 应该用于加载模型的位数，例如16位、8位、4位
1.2 : 表示在GPU内存中加载其他内容的20%开销

常用大模型内存占用

大小（billion）	模型位数	显存占用（GB）
1.5B	4	0.9
1.5B	8	1.8
1.5B	16	3.6
7B	4	4.2
7B	8	8.4
7B	16	16.8
9B	4	5.4
9B	8	10.8
9B	16	21.6
40B	4	24
40B	8	48
40B	16	96
70B	4	42
70B	8	84
70B	16	168

量化大模型的标准写法

经常看到量化大模型后面带着q2_k 、ft16 、 q5_k_s 、q8_0 等写法。这类写法代表着大模型的量化后的指标，释义如下：

传统量化

包括q4_0、q4_1、q8_0等方法。

如q4_0。代表模型位数=4，0表示保留0位小数。即数据会被量化到0-255之间的整数

K值量化

如q2_k、q5_k_s 等方法。实际上就是不同层用不同精度量化，以比传统量化更智能的方式分配bit。解压缩方式与传统量化类似,同样快速

标签：显存,7B,16,模型,开源,量化,GPU
From： https://www.cnblogs.com/zer0Black/p/18403655

【开源免费】基于SpringBoot+Vue.JS房屋租赁系统（JAVA毕业设计）
本文项目编号T020，文末自助获取源码\color{red}{T020，文末自助获取源码}......
JAVA开源项目学生心理咨询评估系统计算机毕业设计
本文项目编号T017，文末自助获取源码\color{red}{T017，文末自助获取源码}......
【开源推荐】MYScrcpy，不仅仅是python实现的Android投屏工具，更是开发测试新选择
MYScrcpyV1.5.7python语言实现的一个Scrcpy客户端。包含完整的视频、音频、控制解析及展现，开发友好，引入即用！采用DearPyGui作为主要GUI。支持窗口位置记忆、右键手势控制、断线重连、虚拟摄像头投屏、中文输入，锁屏密码解锁等功能。高速模式使用pygame作为鼠标及键......
8G 显存玩转书生大模型 Demo
8G显存玩转书生大模型Demo首先第一步依旧是创建我们的开发机,选择上我们需要选择10%的开发机，镜像选择为Cuda-12.2。在输入开发机名称后，点击创建开发机。这里就不放创建的流程图了环境配置#创建环境condacreate-ndemopython=3.10-y#激活环境condaactivate......
Git Extensions：一个.NET开源的 Git 图形用户界面（GUI）工具
前言今天大姚给大家分享一个.NET开源、免费的用于管理Git存储库的独立图形用户界面（GUI）工具，它还与Windows资源管理器和MicrosoftVisualStudio(2015/2017/2019/2022)集成：GitExtensions。Git新手指南：从基础到实践的全方位教程功能介绍图形用户界面：提供一个友好的......
AntFlow开源仿钉钉低代码工作流平台集成RuoYi版本来啦
AntFlow是一款采用Springboot+Mybatis+activiti+ruoyi+vue3等主流前后端技术开发的仿钉钉工作流引擎，结合中国式办公特点深度定制，可以作为钉钉工作流的开源替代。致力解决传统activiti/flowable流程图必须由专业程序员绘制，学习曲线陡峭，上手难、排查问题难、维护成本高等问题......
ThingsBoard 开源物联网平台
ThingsBoard是一个开源物联网平台，可实现物联网项目的快速开发、管理和扩展参考地址：https://iothub.org.cn/docs/iot/目标：是提供成熟的IoT云或本地解决方案以此做为你的IoT应用程序服务端基础架构。ThingsBoard设计为：扩展性：可水平扩展的平台使用领先的开源技术构建......
U3D德州工程源码带视频教程带控服务端打包透视客户端u3d打包java后端Spring Boot框架
U3D德州工程源码带控服务端打包透视客户端u3d打包java后端SpringBoot框架实现技术安卓苹果U3D开发，C#语言后端java SpringBo完整开源不加密，搭建视频教程https://www.bilibili.com/video/BV1PnHLewEkZ/长达八十分钟的搭建教程......
【开源免费】基于SpringBoot+Vue.JS网上订餐系统（JAVA毕业设计）
本文项目编号T018，文末自助获取源码\color{red}{T018，文末自助获取源码}......
Azkaban：强大的开源工作流调度系统
一、概述在大数据生态系统中，随着数据量的爆炸式增长和任务复杂度的提升，管理和调度大规模的批处理任务成为了一项艰巨的挑战。Azkaban是LinkedIn开发的一款开源工作流调度系统，专为管理和调度大规模的Hadoop作业设计。它提供了一种简单且有效的方式来定义、调度和监控复......