【AutoML】强化学习如何用于模型量化？

时间：2022-10-12 18:07:25浏览次数：62

标签：MobileNet 模型 AutoML HAQ 量化精度

大家好，欢迎来到专栏《AutoML》，在这个专栏中我们会讲述AutoML技术在深度学习中的应用，这一期讲述在模型量化中的应用。

作者&编辑 | 言有三

上一期给大家介绍了AutoML技术在模型剪枝中的应用，而量化作为模型压缩的另外一个技术，是学术界和工业界的重点研究方向，今天给大家介绍AutoML在模型量化中的应用思路。

1 HAQ(混合精度量化学习)

HAQ(Hardware-Aware Automated Quantization with Mixed Precision)是一个自动化的混合精度量化框架，使用增强学习让每一层都学习到了适合该层的量化位宽。

【AutoML】强化学习如何用于模型量化？_卷积

不同的网络层有不同的冗余性，因此对于精度的要求也不同，当前已经有许多的芯片开始支持混合精度。通常来说，浅层特征提取需要更高的精度，卷积层比全连接层需要更高的精度。如果手动的去搜索每一层的位宽肯定是不现实的，因此需要采用自动搜索策略。

另一方面，一般大家使用FLOPS，模型大小等指标来评估模型压缩的好坏，然后不同的平台表现出来的差异可能很大，因此HAQ使用了新的指标，即芯片的延迟和功耗。

搜索的学习过程是代理Agent接收到层配置和统计信息作为观察，然后输出动作行为即权值和激活的位宽。其中一些概念如下：

(1) 观测值-状态空间，一个10维变量，如下：

【AutoML】强化学习如何用于模型量化？_深度学习_02

(2) 动作空间，使用了连续函数来决定位宽，离散的位宽如下：

【AutoML】强化学习如何用于模型量化？_搜索_03

(3) 反馈，利用硬件加速器来获取延迟和能量作为反馈信号，以指导Agent满足资源约束。

(4) 量化，直接使用线性量化方法，其中s是缩放因子，clamp是截断函数。

【AutoML】强化学习如何用于模型量化？_深度学习_04

(5) c的选择是计算原始分布和量化后分布的KL散度，这也是很多框架中的做法。

【AutoML】强化学习如何用于模型量化？_搜索_05

(5) 奖励函数，在所有层被量化过后，再进行1个epoch的微调，并将重训练后的验证精度作为奖励信号。

【AutoML】强化学习如何用于模型量化？_深度学习_06

(6) 代理，使用了深度确定性策略梯度（DDPG）方法。

【AutoML】强化学习如何用于模型量化？_卷积_07

上图是在延迟约束下，MobileNet-V1/V2模型在边缘端和云端设备上的实验结果，与固定的8bit量化方法相比，分别取得了1.4倍到1.95倍的加速。

【AutoML】强化学习如何用于模型量化？_深度学习_08

上图分别是边缘端和云端设备上MobileNet-V1各个网络层的量化特点，可以发现在边缘端设备上depthwise卷积有更少的bits，pointwise有更多，在云端则是完全相反。这是因为云设备具有更大的内存带宽和更高的并行性，而depthwise就是内存受限的操作，pointwise则是计算受限的操作，MobileNet-V2上能观察到同样的特点。

另外还有能量约束和模型大小约束的结果，读者可以读原始论文获取细节。

与HAQ类似的研究还有AutoDB[2]等，感兴趣同学可以延伸阅读。

【AutoML】强化学习如何用于模型量化？_卷积_09

标签：MobileNet,模型,AutoML,HAQ,量化,精度
From： https://blog.51cto.com/u_14122493/5751231

【AutoML】当前有哪些可用的AutoML平台？
大家好，欢迎来到专栏《AutoML》，在这个专栏中我们会讲述AutoML技术在深度学习中的应用，这一期讲述现有可用的AutoML平台。作者&编辑|言有三自从Google提出AutoML那天起，工业界......
【杂谈】当前模型量化有哪些可用的开源工具？
模型量化属于模型优化中的重要技术之一，是非常有效地提升模型推理速度的技术方案，那么当前有哪些可用的模型量化工具呢？作者&编辑|言有三1 TensorflowLiteTensorFlowLite......
【PCL模块解析 07 之点云分割】01 平面模型分割
目录一、前言二、PCL简介1、PCL简介2、PCL分割三、平面模型分割1、全部代码2、分块介绍1.创建数据2......
【调参实战】BN和Dropout对小模型有什么影响？全局池化相比全连接有什么劣势？...
大家好，欢迎来到专栏《调参实战》，虽然当前自动化调参研究越来越火，但那其实只是换了一些参数来调，对参数的理解和调试在机器学习相关任务中是最基本的素质，在这个专栏中我们会带......
【GAN优化】最早被用于评价GAN模型的定量指标Inception Score是什么
最近一部分的内容将会比较容易，将和大家一起讨论GAN的评价指标，也没有太难以理解的东西，希望大家踊跃讨论，欢迎留言。作者&编辑|小米粥编辑|言有三在判别模型中，训练完成的模......
【GAN优化外篇】详解生成模型VAE的数学原理
最近在学习生成模型的相关知识，这篇文章将介绍一下变分自编码器（VariationalAuto-encoder），本文只介绍一些粗浅内容，不会涉及比较深刻的问题。作者&编辑|小米粥1. 自编码器......
【语音处理】声音的产生机制和数学模型
上一节介绍了一些基本的概念和应用，从本节开始我们将对语音信号处理的各个方面进行系统性介绍。本节主要介绍语音产生的过程，包括具体的生理机制，以及由此抽象出的数学模型，包括......
【AutoML】强化学习如何用于自动模型设计(NAS)与优化？
大家好，欢迎来到专栏《AutoML》，在这个专栏中我们会讲述AutoML技术在深度学习中的应用，这一期讲述强化学习用于模型设计和优化的核心技术。作者&编辑|言有三一直以来，网络结构......
【chainer速成】chainer图像分类从模型自定义到测试
文章首发于微信公众号《有三AI》【chainer速成】chainer图像分类从模型自定义到测试欢迎来到专栏《2小时玩转开源框架系列》，这是我们第八篇，前面已经说过了caffe，tens......
【MatConvnet速成】MatConvnet图像分类从模型自定义到测试
欢迎来到专栏《2小时玩转开源框架系列》，这是我们第10篇，前面已经说过了caffe，tensorflow，pytorch，mxnet，keras，paddlepaddle，cntk，chainer，deeplearning4j。今天说MatConvnet，本文所用......

【AutoML】强化学习如何用于模型量化？

相关文章

赞助商

阅读排行