神经网络中的量化与蒸馏

时间：2023-11-14 10:24:11浏览次数：35

本文将深入研究深度学习中精简模型的技术：量化和蒸馏

深度学习模型，特别是那些具有大量参数的模型，在资源受限环境中的部署几乎是不可能的。所以就出现了两种流行的技术，量化和蒸馏，它们都是可以使模型更加轻量级，而不会对性能造成太大影响。但是它们需要什么，它们又如何比较呢?

量化:牺牲精度换取效率

量化是关于数字精度的。通过减少模型中权重和激活的位宽度，缩小模型大小，从而潜在地提高推理速度。

神经网络有相互连接的神经元，每个神经元都有在训练过程中调整的权重和偏差。这些参数值一般存储在32位浮点数中，这样虽然保证了精度，但占用了大量内存。例如，一个50层的ResNet需要168MB来存储2600万32位权重值和1600万32位激活值。

量化旨在通过使用较低的位数(如8位整数)来表示权重和激活，来减少内存占用。但这引入了量化误差，所以量化的目标是在精度和内存使用之间取得平衡。像每通道量化、随机舍入和再训练这样的先进技术可以最大限度地减少对模型精度的影响。

最常见的两种量化情况是：float32 -> float16和float32 -> int8。

https://avoid.overfit.cn/post/f2c1456d33094a439903409792f75729

标签：蒸馏,32,模型,神经网络,量化,精度
From： https://www.cnblogs.com/deephub/p/17831022.html

神经网络入门篇：详解多样本向量化（Vectorizing across multiple examples）
多样本向量化与上篇博客相联系的来理解逻辑回归是将各个训练样本组合成矩阵，对矩阵的各列进行计算。神经网络是通过对逻辑回归中的等式简单的变形，让神经网络计算出输出值。这种计算是所有的训练样本同时进行的，以下是实现它具体的步骤：图1.4.1上篇博客中得到的四个等式。它们......
机器学习——循环神经网络的实现
独热编码回想一下，在train_iter中，每个词元都表示为一个数字索引，将这些索引直接输入神经网络可能会使学习变得困难。我们通常将每个词元表示为更具表现力的特征向量。最简单的表示称为独热编码（one-hotencoding），它在 3.4.1节中介绍过。简言之，将每个索引映射为相互不同的单位向......
机器学习——循环神经网络
隐状态无隐状态的神经网络有隐状态的循环神经网络循环神经网络（recurrentneuralnetworks，RNNs）是具有隐状态的神经网络。基于循环神经网络的字符级语言模型回想一下 8.3节中的语言模型，我们的目标是根据过去的和当前的词元预测下一个词元，因此我们将原始......
【深度学习笔记】第3章-神经网络基础
参考书籍：邓立国等《python深度学习原理、算法与案例》清华大学出版社3.3感知机3.3.1感知机模型感知机，又称阈值逻辑单元（ThresholdLogicUnit，TLU）/线性阈值单元（LinearThresholdUnit，LTU）经典数据集：IrisDataSet（鸢尾属植物数据集）但是这个数据集有些复杂，没什么必要用，自己写......
深度学习模型---卷积神经网络
深度学习深度学习模型是一种机器学习方法，它模仿人脑神经网络的结构和功能，通过多层次的神经网络进行学习和推断。深度学习模型在计算机视觉、自然语言处理、语音识别等领域取得了显著的成果。深度学习模型的基本单元是神经网络，它由大量的人工神经元组成，每个神经元都与其他神经元......
开发一款量化交易APP软件系统
市场的行情都是在不断变化的，量化也会成为一种创业的趋势，为了实现广大创业者的量化交易需求，我们对市场的分析后开发一款量化交易的app软件。一、系统概述该系统软件基于移动端的量化交易，体现为创业者提供便捷，高效的交易服务。该系统软件采用的是量化交易算法，结合大数据，历史数据，人......
量化交易APP开发解决方案
一、项目背景量化软件的需求日益的增加，开发一款量化交易app软件显得特别的钟涛，该软件的能够快速帮助用户获得市场的重要信息，通过分析得到相关的商机，制定相关的交易策略，提高交易的利润。二、功能设计1.数据获取：量化数据的获取，通过市场的接口，大数据的分析软件对接，得到市场的变化规......
合约量化交易系统APP开发案例
项目背景：该案例软件的开发是一款针对市场交易员而设计的软件系统，它能帮助交易者实现高效率的合约交易。我们目的是以用户的需求为主进行开发，应对市场上未知的风险和把控。开发过程：软件在开发过程中，采用了多种的开发按技术，软件工具包，开发框架，数据库技术，移动端的开发。在开发前先......
【机哥】基于神经网络的声音增强器
鱼弦：内容合伙人、新星导师、全栈领域创作新星创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）基于神经网络的声音增强器是一种利用深度学习模型来改善音频信号质量的系统。下面我将详细解释其原理、架构流程......
神经网络入门篇：详解计算一个神经网络的输出（Computing a Neural Network's output）
一个神经网络的输出首先，回顾下只有一个隐藏层的简单两层神经网络结构：图1.3.1其中，\(x\)表示输入特征，\(a\)表示每个神经元的输出，\(W\)表示特征的权重，上标表示神经网络的层数（隐藏层为1），下标表示该层的第几个神经元。这是神经网络的符号惯例，下同。神经网络的计算关于神经网络是怎......

神经网络中的量化与蒸馏

量化:牺牲精度换取效率

相关文章

赞助商

阅读排行