FP32:
1bit符号位,10bit指数,23bit底数位。
FP16:
1bit符号位,5bit指数,10bit底数位。
FP16转FP32
- NAN/INF:对应的FP32的值
- +0/-0: +0/-0
- normal:指数+0x70,底数左移13位
- subnormal:对应的FP32属于normal,需要继续左移至最高位为1的省略掉。(0x0078, 需要左移四位),指数+0x70-(x-1)(x为底数左移位数,-1是额外左移值-1)
例如:FP16的0x0078转换成FP32是0x36F00000.
https://blog.csdn.net/ysaeeiderup/article/details/124104042
标签:FP32,浮点数,左移,底数,0x0078,FP16 From: https://www.cnblogs.com/xuekui-jin/p/18326264