以一道经典笔试题为例:对12.918做无损定点化,需要的最小位宽是多少位,位宽选择11位时的量化误差是多少?
首先,明确一个知识点:无损量化,即量化误差小于量化精度的一半。
因此,对于整数,12需要的4位( 0~15) 二进制。
12bit量化的情况:整数占4bit, 小数占8bit, 量化精度为1/( 2^8)= 1/256= 0.00390625。
则0.918需要:0.918/0.00390625=235.008个精度表示, 四舍五入为235。
235个精度所表达的数为:235*0.00390625=0.91796875。
量化误差为:0.918-0.91796875=0.00003125,也可以表示为舍弃的0.008*量化精度0.00390625,即为0.00003125,小于量化精度的一半( 0.00390625/2)
所以认为无损量化,12bit即可满足要求。
11bit量化的情况:整数占4bit, 小数占7bit, 量化精度为1/( 2^7)= 1/128= 0.0078125。
则0.918需要:0.918/0.0078125=117.504个精度表示, 四舍五入为117。
117个精度所表达的数为:117*0.0078125=0.921875。
量化误差为:|0.918-0.921875|=0.003875,同样可以表示为增加的0.496个刻度*量化精度0.0078125,即为0.003875。