首页 > 其他分享 >浮点数理解梳理

浮点数理解梳理

时间:2022-12-08 17:38:09浏览次数:57  
标签:二进制 浮点数 float 小数点 尾数 理解 127 梳理 小数

 

先说一下计算机中二进制的​​算法​​:

· 整数 
整数的二进制算法大家应该很熟悉,就是不断的除以2取余数,然后将余数倒序排列。比如求9的二进制: 
9/2=4 余 1 
4/2=2 余 0 
2/2=1 余 0 
1/2=0 余 1 
一直计算到商为0为止,然后将得到的余数由下到上排列,就得到了9的二进制:1001。 
从上面的算法我们可以看到,用整数除以2,最终都能够到0。因此,整数是可以用二进制来精确表示的。

· 小数 
小数的二进制算法和整数的大致相反,就是不断的拿小数部分乘以2取积的整数部分,然后正序排列。比如求0.9的二进制: 
0.9*2=1.8 取 1 
0.8*2=1.6 取 1 
0.6*2=1.2 取 1 
0.2*2=0.4 取 0 
0.4*2=0.8 取 0 
0.8*2=1.6 取 1 
… … 
如此循环下去。因此我么得到的二进制小数也是无限循环的:0.11100110011... 
从小数的二进制算法中我们可以知道,如果想让这种算法停止,只有在小数部分是0.5的时候才可以,但是很不幸,这类的小数很少。所以大部分小数是很难用二进制来精确表示的。

------------------------我是分割线------------------------------ 

OK,有了上面的知识,我们进入正题:看看float类型在内存中是如何表示的。  
float类型又称为单精度浮点类型,在 ​​IEEE 754-2008​中是这样定义它的结构的:

  S     EEEEEEEE      FFFFFFFFFFFFFFFFFFFFFFF
31     30        23          22                               0

 

浮点数理解梳理_浮点数

float类型总共4个字节——32位:

1. 符号位
其中最左边的为符号位,0为正,1为负。

2. 指数
接下来的E是指数,一共8位,也用二进制来表示。

3. 尾数
最后的F是小数部分,尾数正是由这23位的小数部分+1位组成的。(这个稍后解释)。

这里我们需要多说一下指数。虽然指数也是用8位二进制来表示的,但是IEEE在定义它的时候做了些手脚,使用了偏移来计算指数。

IEEE规定,在float类型中,用来计算指数的偏移量为127。也就是说,如果你的指数实际是0,那么在内存中存的就是0+127=127的二进制。稍后我们来看这个到底如何使用。

 

好了,看了这么多,我们该演示一下计算机如何将一个十进制的实数转换为二进制的。就拿6.9这个数字来举例吧。-_-||!

 

首先,我们按照上面说的方法,分别将整数和小数转换成对应的二进制。这样6.9的二进制表示就是110.1110011001100...。这里就看出来 了,6.9转换成二进制,小数部分是无限循环的,这在现在的计算机系统上是无法精确表示的。这是计算机在计算浮点数的时候常常不精确的原因之一。

 

其次,将小数点左移(或右移)到第一个有效数字之后。说的通俗些,就是把小数点移到第一个1之后。这样的话,对于上面的110.1110011001100...我们就需要把小数点左移2位,得到1.101110011001100...。

 

接下来的事情就有意思了。首先我们把得到的1.101110011001100..这个数,从小数点后第一位开始,数出23个来,填充到上面float内存 结构的尾数部分(就是那一堆F的地方),我们这里数出来的就是10111001100110011001100。这里又要发生一次不精确了,小数点后超出23位的部分都将被舍弃,太惨了。

 

不过,这里有一个可能让大家觉得特别坑爹的事情,就是小数点前面的1也不要了。仔细看看上面的内存结构,确实没有地方存放这个1。原因是这样的:IEEE觉 得,既然我们大家都约定把小数点移动到第一个有效数字之后,那也就默认小数点前面一定有且只有一个1,所以把这个1存起来也浪费,干脆就不要了,以后大家 都这么默契的来就好。这也是为什么我上面说尾数是23位+1位的原因。

 

填充完尾数,该填充指数了。这个指数就是刚才我们把小数点移动的位数,左移为正,右移为负,再按照上面所说的偏移量算法,我们填充的指数应该是2+127=129。转换成8位二进制就是10000001。

 

最后,根据这个数的正负来填充符号位。我们这里是正数,所以填0。这样6.9的在内存中的存储结果就出来了:

0  10000001  10111001100110011001100

 

总结一下,实数转二进制float类型的方法:

A. 分别将实数的整数和小数转换为二进制
B. 左移或者右移小数点到第一个有效数字之后
C. 从小数点后第一位开始数出23位填充到尾数部分 
D. 把小数点移动的位数,左移为正,右移为负,加上偏移量127,将所得的和转换为二进制填充到指数部分
E. 根据实数的正负来填充符号位,0为正,1为负

如果需要把float的二进制转换回十进制的实数,只要将上面的步骤倒着来一边就行了。

 

 

下面举例说明:

float型数据125.5转换为标准浮点格式

125二进制表示形式为1111101,小数部分表示为二进制为1,则125.5二进制表示为1111101.1,由于规定尾数的整数部分恒为1,则表示为1.1111011*2^6,阶码为6,加上127为133,则表示为10000101,而对于尾数将整数部分1去掉,为1111011,在其后面补0使其位数达到23位,则为11110110000000000000000

则其二进制表示形式为

0 10000101 11110110000000000000000,则在内存中存放方式为:

00000000   低地址

00000000

11111011

01000010   高地址

而反过来若要根据二进制形式求算浮点数如0 10000101 11110110000000000000000

由于符号为为0,则为正数。阶码为133-127=6,尾数为11110110000000000000000,则其真实尾数为1.1111011。所以其大小为

1.1111011*2^6,将小数点右移6位,得到1111101.1,而1111101的十进制为125,0.1的十进制为1*2^(-1)=0.5,所以其大小为125.5。

同理若将float型数据0.5转换为二进制形式

0.5的二进制形式为0.1,由于规定正数部分必须为1,将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为

0 01111110 00000000000000000000000

 

 

浮点数应用

引进eps,来辅助判断浮点数的相等。

eps缩写自epsilon,表示一个小量,但这个小量又要确保远大于浮点运算结果的不确定量。eps最常见的取值是1e-8左右。

 


这样,我们才能把相差非常近的浮点数判为相等;同时把确实相差较大(差值大于eps)的数判为不相等。

 

 

eps带来的函数越界

如果sqrt(a), asin(a), acos(a)中的a是你自己算出来并传进来的,那就得小心了。

如果a本来应该是0的,由于浮点误差,可能实际是一个绝对值很小的负数(比如1e-12),这样sqrt(a)应得0的,直接因a不在定义域而出错。

类似地,如果a本来应该是±1,则asin(a)、acos(a)也有可能出错。

因此,对于此种函数,必需事先对a进行校正。

 

测试数据内存存储:

//高低字节交换
unsigned char i;
float floatVariable;
unsigned char charArray[4];
(unsigned char)*pdata = ((unsigned char)*)&floatVariable;  //把float类型的指针强制转换为unsigned char型
for (i = 0; i<4; i++)
{
charArray[i] = *pdata++;//把相应地址中的数据保存到unsigned char数组中     
}


大小比较:

#define EPSILON 1e-6

float a = 0.00001;
float b = 0.00003;


if (fabs(a-b) <= EPSILON)
{
printf("a==b\r\n");
}
else
{
printf("a!=b\r\n");
}

标签:二进制,浮点数,float,小数点,尾数,理解,127,梳理,小数
From: https://blog.51cto.com/u_6958388/5922944

相关文章

  • 数列知识总结梳理
    本篇文章重点梳理数列章节相关的知识,以及在求解数列相关问题时比较常用且能较好地简便计算的方法。有关等差数列与等比数列的内容本文主要是以给出性质为主,中点在于后两部......
  • Model-Agnostic Meta-Learning (MAML) 理解
    模型不可知元学习(Model-AgnosticMeta-Learning,MAML)的目标是使模型每次的梯度更新更有效、提升模型的学习效率、泛化能力等,它可以被看做一种对模型进行预训练的方法,......
  • 对于CocoaPods的简单理解,实践安装使用过程和常见问题
    (本文是自己通过其他文章进行的自我编辑和简单修改,请大家凑活看看。)一、什么是CocoaPodsCocoaPods是iOS项目的依赖管理工具,该项目源码在Github上管理。开发iOS项目不可避免地......
  • (转)理解Heap Profling名词-Shallow和Retained Sizes
    ​​http://rdc.taobao.com/team/jm/archives/900​​​有包含HeapProfling功能的工具(MAT,Yourkit,JProfiler,TPTP等)都会使用到两个名词,一个是S......
  • [转]一文读懂浮点数
    原文地址:一文读懂浮点数-知乎(zhihu.com)小数在日常生活中经常用到,比如超市中商品的价格、零件的尺寸等等,计算机作为计算的工具,也必然要支持小数。在计算机中,小数的类......
  • 算法 KECP 被顶会 EMNLP 收录,极少训练数据就能实现机器阅读理解
    作者:王嘉宁、汪诚愚、邱明辉、石秋慧、王洪彬、黄俊、高明近日,阿里云机器学习平台PAI与华东师范大学高明教授团队合作在自然语言处理顶级会议EMNLP2022上发表基于Prompt-Tun......
  • 由浅入深理解委托与事件
    引言看过上一篇文章的朋友应该知道,要想给一个类添加自定义事件,首先要添加一个委托,然后通过这个委托声明一个事件,在主程序中其他类只要有符合那个委托的方法,就可以用这......
  • 多模态文档LayoutLM版面智能理解技术演进-纪传俊
    多模态算法兴起的背景办公文档是各行各业最基础也是最重要的信息载体,不管是金融、政务、制造业、零售行业等等,各种类型的文档都是业务流转过程中必不可少的数字资料。以银行......
  • 多模态文档LayoutLM版面智能理解技术演进-纪传俊
    多模态算法兴起的背景办公文档是各行各业最基础也是最重要的信息载体,不管是金融、政务、制造业、零售行业等等,各种类型的文档都是业务流转过程中必不可少的数字资料。以银行......
  • mysql page_一文理解MySQL中的page页--转
    在介绍InnoDB中的页的时候,很有必要先让大家了解一下InnoDB中的存储结构从InnoDB存储引擎的逻辑结构看,所有数据都被逻辑地存放在一个空间内,称为表空间(tablespace),而表空......