训练后量化(Post-training Quantization,PTQ)是一种常见的模型量化技术,它在模型训练完成之后应用,旨在减少模型的大小和提高推理速度,同时尽量保持模型的性能。训练后量化对于部署到资源受限的设备上,如移动设备和嵌入式设备,特别有用。
在我们量化时,量化操作可以应用于模型的输入、权重 和 激活(即神经元输出值)上。
但我们发现,对于激活值,我们执行反量化时,并不知道这些激活值对应的浮点数矩阵的最大值和最小值,即我们执行非对称或对称量化里面的
标签:model,代码,torch,print,量化,net,self,PTQ From: https://blog.csdn.net/weixin_45116099/article/details/136685937