目录
前言
数据在内存中根据数据类型有不同的存储方式,今天我们就来了解一下,我们常见的数据类型在内存中的存储方式。
一、整数在内存中的存储
在之前讲操作符时我们讲了整形在内存中以二进制存放:C语言操作符详解
整数的2进制表⽰方法有三种,即 原码 、 反码 和 补码 三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位最 高位的⼀位是被当做符号位,剩余的都是数值位。 正整数的原、反、补码都相同。 负整数的三种表示方法各不相同。 原码 :直接将数值按照正负数的形式翻译成⼆进制得到的就是原码。 反码 :将原码的符号位不变,其他位依次按位取反就可以得到反码。 补码 :反码+1就得到补码。 对于整形来说:数据存放内存中其实存放的是 补码 。 因为使用补码,可以将符号位和数值域统⼀处理,同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。二、大小端字节序和字节序判断
当我们知道了整形在内存中如何存储时,我们来看下面一段代码:
#include<stdio.h>
int main()
{
int a = 0x11223344;
return 0;
}
我们发现为什么是44 33 22 11这种顺序存储的,这时我们就要引入大小端字节序的概念了。
其实超过⼀个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储,下⾯是具体的概念: 大端(存储)模式 :是指数据的 低位字节 内容保存在内存的 高地址 处,而数据的 高位字节 内容,保存在内存的 低地址 处。(低->高,高->低) 小端(存储)模式 :是指数据的 低位字节 内容保存在内存的 低地址 处,而数据的 高位字节 内容,保存在内存的 高地址 处。(低->低,高->高) 为什么有大小端之分呢? 这是因为在计算机系统中,我们是以 字节 为单位的,每个地址单元都对应着⼀个字节,⼀个字节为8bit 位,但是在C语⾔中除了8 bit 的 char 之外,还有16 bit 的 short 型,32 bit 的 long 型(要看 具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于⼀个字节,那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了 ⼤端存储模式 和 小端存储模式 。 例如:⼀个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么0x11 为⾼字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中,0x22 放在⾼地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。 那我们来看看几道练习题:2.1.练习一
设计一个小程序来判断当前机器的字节序
#include<stdio.h>
int check_sys()
{
int i = 1;
return (*(char*)&i);
}
int main()
{
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
这里1在内存中存储为00000000000000000000000000000001,可以换为16进制00 00 00 01,如果是小端存储则在内存中字节序为01 00 00 00 ,所以强制类型转换为char访问一个字节就是01,如果是大端存储就是00 00 00 01,返回的就是00。
2.2 练习二
#include<stdio.h>
int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("a=%d,b=%d,c=%d", a, b, c);
return 0;
}
其中char类型的-1在内存中表示为11111111,所以通过%d打印后要进行整型提升变为11111111111111111111111111111111,打印出来还是-1,signed char与char类型一样。
unsigend char由于是无符号的,所以最高位不为符号位。在内存中存储图解:
所以unsigend char类型范围为0~255。
在unsigend char中-1为11111111,与255一样,所以c输出为255。
2.3 练习三
#include <stdio.h>
int main()
{
char a = -128;
printf("%u\n",a);
return 0;
}
在char类型中,数据是有符号的所以最高位为符号位,在内存中存储图解:
其中127+1后10000000为 -128,所以char整型范围为-128~127。
%u为通过无符号的整型打印,-128为10000000通过整型提升为1111111111111111111111110000000,由于无符号打印,所以最高位不是符号位,所以为正数,正数原反补码相同。
#include <stdio.h>
int main()
{
char a = 128;
printf("%u\n",a);
return 0;
}
128在char中存放也是10000000,所以结果通过与上面一样:
2.4 练习四
#include<stdio.h>
int main()
{
char a[1000];
int i;
for (i = 0; i < 1000; i++) {
a[i] = -1 - i;
}
printf("%d", strlen(a));
return 0;
}
分析上面代码我们知道,循环-1,-2,-3,-4.....strlen遇到'\0'停止。但是数组为char类型,char类型范围为-128~127,所以到根据char类型数据存储-128时再减1就变成了127了
直到到0也就是’\0‘的ASCII值停止。结果为|-128|+127=255
2.5 练习五
#include <stdio.h>
unsigned char i = 0;
int main()
{
for(i = 0;i<=255;i++)
{
printf("hello world\n");
}
return 0;
}
根据前面我们可知unsigned char范围为0~255,所以当i为255时,加1又变成0了,所以会无限循环代码。
同理,下面这段代码,当i=0时,减1又变成了255,所以i永远不会小于0,所以无限循环。
#include<stdio.h>
int main()
{
unsigned int i;
for (i = 9; i >= 0; i--)
{
printf("%u\n", i);
}
return 0;
}
2.6 练习六
#include <stdio.h>
int main()
{
int a[4] = { 1, 2, 3, 4 };
int *ptr1 = (int *)(&a + 1);
int *ptr2 = (int *)((int)a + 1);
printf("%x,%x", ptr1[-1], *ptr2);
return 0;
}
下面是对代码的分析:
int main()
{
int a[4] = { 1, 2, 3, 4 };
//01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00 在内存中的存储
int* ptr1 = (int*)(&a + 1);
//&a为数组的地址,+1跳过整个数组
int* ptr2 = (int*)((int)a + 1);
//a为数组首地址,强制类型转换为整型,整型加1,直接加1
printf("%#x,%#x", ptr1[-1], *ptr2);
//ptr[-1]==*(ptr-1) ptr类型为int* ptr为数组尾地址,-1,为元素4的地址
//*ptr ptr为01 后面 00的地址,ptr为int*,解引用访问四个字节 00 00 00 02,因为小端存储所以为0x2000000
return 0;
}
三、浮点数在内存中的存储
在了解浮点数在内存中的存储之前,我们先来看看下面一段代码:
#include <stdio.h>
int main()
{
int n = 9;
float *pFloat = (float *)&n;
printf("n的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
*pFloat = 9.0;
printf("num的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
return 0;
}
大家觉得输出结果是什么呢?
为什么会出现这样的结果呢?那让我们来了解一下浮点数在内存中的存储。
根据国际标准IEEE(电气和电子工程协会) 754,任意⼀个二进制浮点数V可以表示成下面的形式: V =(−1)^S * M ∗ 2^E
• (−1)S 表⽰符号位,当S=0,V为正数;当S=1,V为负数
• M表⽰有效数字,M是⼤于等于1,⼩于2的
• 2^E表⽰指数位
比如说
十进制的5.0 二进制表示为101.0 相当于1.01×2^2,此时S=0,M=1.01,E=2。
十进制的-5.0,写成⼆进制是 -101.0 ,相当于 -1.01×2^2 。那么,S=1,M=1.01,E=2。
十进制的0.5,写成二进制就是0.1 相当于1.0×2^-1,那么S=1,M=1,E=-1。
IEEE 754规定: 对于32位的浮点数,最高的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M (float类型) 对于64位的浮点数,最高的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M (double类型)3.1 浮点数存的过程
IEEE 754 对有效数字M和指数E,还有一些特别规定。 前面说过, 1 ≤ M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。 IEEE 754 规定,在计算机内部保存M时,默认这个数的第⼀位总是1,因此可以被 舍去 ,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第⼀位的1加上去。这样做的目的,是 节省1位有效数字 。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保存24位有效数字。 至于指数E,情况就比较复杂 ⾸先,E为⼀个⽆符号整数(unsigned int)这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上⼀个 中间数 ,对于8位的E,这个中间数是 127 ;对于11位的E,这个中间数是 1023 。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。3.2 浮点数取的过程
指数E从内存中取出还可以再分成三种情况: 1.E不全为0或不全为1 这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第⼀位的1。 比如:0.5 的⼆进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则1.0*2^(-1),其阶码为-1+127(中间值)=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位 00000000000000000000000,则其⼆进制表示形式为:0 01111110 00000000000000000000000
2.E全为0
这时,浮点数的指数E等于 1-127 (或者 1-1023 )即为真实值,有效数字M不再加上第⼀位的1,而是还原为0.xxxxxx的小数。这样做是为了表示 ±0 ,以及接近于0的 很小的数字 。0 00000000 00100000000000000000000
3.E全为1
这时,如果有效数字M全为0,表示±无穷⼤(正负取决于符号位s);
0 11111111 00010000000000000000000
了解完浮点数在内存中的存储后,我们来看看刚才的题:
#include <stdio.h>
int main()
{
int n = 9;
float *pFloat = (float *)&n;
printf("n的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
*pFloat = 9.0;
printf("num的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
return 0;
}
9在内存中的存储为00000000 00000000 00000000 00001001
如果以浮点数进行存储则为0 00000000 000 0000 0000 0000 0000 1001
由于指数E全为0,所以符合E为全0的情况。因此,浮点数V就写成:
V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146) 由于这是一个非常小的数,接近与0,所以用十进制小数表示就是0.000000。 由于*pFloat=9.0,用二进制表示1001.0,及为1.001 ×2^3 在内存中表示:0 10000010 001 0000 0000 0000 0000 0000
这个32位的⼆进制数,被当做整数来解析的时候,就是整数在内存中表示,原码正是1091567616
总结
上述文章讲了整型,浮点型在内存中的存储,和大小端的概念,希望对你有所帮助。
标签:存储,字节,int,00,C语言,char,内存 From: https://blog.csdn.net/2301_76613753/article/details/136780611