【白话模型量化系列一】矩阵乘法量化

时间：2022-11-28 18:00:36浏览次数：59

标签：白话模型矩阵整数量化 int8 乘法

模型量化是模型加速方向一个很重要的方法，主要思想就是用int8数据格式来存储和进行计算。这样做有两点好处：

可以减小模型存储的体积。原本float32存储需要4个字节，现在int8存储只需要1个字节，体积是原来的1/4。
可以加快计算速度。这主要是因为int8数据的读写更快，并且int8矩阵乘法一般来说会更快一点。

以现在最常用的Transformer模型来举例，在使用CUDA推理加速库（例如LightSeq）之后，矩阵乘法的占比高达将近90%。所以优化非矩阵乘法的速度意义不是很大了，占比不高，你算得再快对整体的提速也很小，因此可以尝试优化矩阵乘法。

那么我们考虑浮点数矩阵乘法

【白话模型量化系列一】矩阵乘法量化_算法

用整数矩阵来表示浮点数矩阵

首先我们需要将一个浮点数矩阵

【白话模型量化系列一】矩阵乘法量化_机器学习_02

接着整数矩阵

【白话模型量化系列一】矩阵乘法量化_人工智能_03

这样我们就可以得到两个浮点数矩阵的整数表示，接下来就可以利用他们来进行整数矩阵乘法的转换。

转化为整数矩阵乘法

整数矩阵

【白话模型量化系列一】矩阵乘法量化_人工智能_04

【白话模型量化系列一】矩阵乘法量化_算法_05

【白话模型量化系列一】矩阵乘法量化_人工智能_06

【白话模型量化系列一】矩阵乘法量化_机器学习_07

【白话模型量化系列一】矩阵乘法量化_机器学习_08

【白话模型量化系列一】矩阵乘法量化_机器学习_09

此外为了减小量化的损失，还需要在模型结构中插入伪量化节点，然后进行量化感知训练（QAT）。接着还需要将finetune后的模型存储为int8格式。然后还需要开发加载int8模型的推理加速库代码。最后就是本文讲到的整数矩阵乘法了。整个流程比较繁琐，这部分内容今后我会慢慢给大家分享。网上关于量化的优秀教程非常多，我不会讲太多理论上的量化知识，只会从实践的角度来白话一下我们在Transformer模型量化过程中做的一些尝试。

标签：白话,模型,矩阵,整数,量化,int8,乘法
From： https://blog.51cto.com/godweiyang/5893251

补码4×4阵列乘法器设计
视频讲解：https://www.bilibili.com/video/BV1ye4y1H7Ao/一、简述乘法运算在全部算数运算中大约占据三分之一，因此采用高速乘法部件，无论从速度上还是效率上，都十分必要。本......
龙哥量化：通达信日线图上画框框，每月初到月末的最高价到最低价画框
代码在末尾，写的不是很好，但是实现了画框框的功能，如果你认为有用，那就收藏吧每月的第一个交易日，到每月的最后一个交易日区间，最高价到最低价画长方形的框框（黄色线），为了清晰度，我......
龙哥量化：通达信分时均线在1分钟5分钟K线图上显示
分时均线代码比较简单新建一个主图指标，粘贴代码即可，效果如下图T1:=DAY<>REF(DAY,1);T2:=BARSLAST(T1)+1;JX:SUM(AMO,T2)/SUM(V,T2)/100; 图一：一分钟K线图 ......
龙哥量化：通达信DRAWICON的图标副图显示效果（鸡肋，可以不看）
新建一个副图指标，复制粘贴源码，先看一下效果图 DRAWTEXT_FIX(1,0.01,0.01,0,'通达信中DRAWICON的图标,方便大家折腾指标'),COLORMAGENTA;A:=CURRBARSCOUNT;A1:=8;A......
龙哥量化：通达信自动画黄金分割线
这个指标，龙哥量化通达信写的，售价100元，QQ，591438821用波浪线计算的高低点，自动画黄金分割线，绝对值得收藏，有未来函数，只是用来参考的，不是直接出买卖点【龙哥QQ：59143882......
龙哥量化：通达信macd和kdj跨周期引用导致信号漂移等未来函数详细解释
跨周期引用macd就是未来函数，导致信号漂移，简直怕了未来函数，那怎么解决呢，调大参数即可，请思考：收盘价>日线ma10  同时，收盘价>周线ma10如果机械式的翻译，公式如......
龙哥量化：通达信财富币不够怎么办：K线训练营100%胜率，赚财富币
龙哥量化，又要放大招了，哈哈，我遇到很多上班族股友用手机选股，不用电脑，手机选股，需要财富币，，，服了tdx这个老六啊那【龙哥量化】就教大家赚财富币，每日登录签到赚5个财富币，这种就......
龙哥量化：通达信00.1
选到头发准干部和拟建柴草vb【龙哥QQ：591438821】【路漫其修远兮，吾将上下而求索】【龙哥量化：代写通达信公式，代写Python量化策略】【如果这篇文章对你有用，请用微信扫码......
mul乘法指令
assumecs:code,ss:stackstacksegmentdb16dup(0)stackendscodesegments:moval,5movbl,3ret;returntoblockclodebeh......
数据分析-股票量化分析需求
需求：股票分析使用tushare包获取某股票的历史行情数据。输出该股票所有收盘比开盘上涨3%以上的日期。输出该股票所有开盘比前日收盘跌幅超过2%的日期。假如我从......

【白话模型量化系列一】矩阵乘法量化

用整数矩阵来表示浮点数矩阵

转化为整数矩阵乘法

相关文章

赞助商

阅读排行