首页 > 系统相关 >数据在内存的存储

数据在内存的存储

时间:2025-01-12 22:58:13浏览次数:3  
标签:存储 符号 int 浮点数 补码 内存 数据 原码

数据类型介绍

前面我们已经学习了基本的内置类型:(后边跟的是字节)

char         //字符数据类型   1字节  打印%c            short       // 短整型       2字节    打印%hd int         //整形      4字节   打印%d long     =long int    //长整型        4/8字节        打印%ld long long  =long long int  //更长的整形    8字节    打印%lld float       //单精度浮点数                4字节        打印%f double       //双精度浮点数                8字节     打印%lf sizeof(long)>=sizeof(int)

整形打印无符号数将格式中的d换成u就行

 类型的基本归类

整形家族: char unsigned char signed char short unsigned short [ int ] signed short [ int ] int unsigned int signed int long unsigned long [ int ] signed long [ int ] long long
浮点数家族: float double long double
构造类型: > 数组类型 > 结构体类型 struct > 枚举类型 enum > 联合类型 union
指针类型 int * pi ; char * pc ; float* pf ; void* pv ; 结构体指针等等

整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。 那接下来我们谈谈数据在所开辟内存中到底是如何存储的? 比如: int a = 20 ; int b = - 10 ; 我们知道为 a 分配四个字节的空间。 那如何存储? 下来了解下面的概念:
原码、反码、补码 计算机中的整数有三种 2 进制表示方法,即原码、反码和补码。 三种表示方法均有 符号位数值位 两部分,符号位都是用 0 表示 “ 正 ” ,用 1 表示 “ 负 ” ,而数值位 正数的原、反、补码都相同。 负整数的三种表示方法各不相同。
原码 直接将数值按照正负数的形式翻译成二进制就可以得到原码。 反码 将原码的符号位不变,其他位依次按位取反就可以得到反码。

补码 反码 +1 就得到补码。
对于整形来说:数据存放内存中其实存放的是补码。为什么呢? 在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统 一处理;同时,加法和减法也可以统一处理(CPU 只有加法器 )此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

下边我们看一个数据存储的例子就好理解了

可以看到,数据在内存是补码存储的,并且是倒着存储的,本质上内存中存放的是2进制,为了方便显示,我们看到的都是16进制的数字(不要害怕不同进制的数字,本质上进制只是表示数字的一种形式)为什么是这样存储的呢接下来我带大家看一下

讲大小端之前我先说明一下原码反码补码的关系(整数原码,反码,补码相同,负数如下) 原码-》补码,先除了符号位按位取反,再+1 补码-》原码,先-1,再除了符号位按位取反
大小端介绍 什么大端小端: 大端(存储)模式,是指数据的低位字节保存在内存的高地址中,而数据的高位字节,保存在内存的低地址中; 小端(存储)模式,是指数据的低位字节保存在内存的低地址中,而数据的高位字节 , ,保存在内存的高地址中。
我们测试一下这个数据 我们知道数据在内存是从低地址向高地址存储的 一个数据的低位字节如果存放在内存的低地址处,代表是小端存储,反之是大端存储
有一道笔试题 百度 2015 年系统工程师笔试题: 请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。( 10 分)
//小端返回1
//大端返回0
int check_sys()
{
	int a = 1;
	return *(char*)&a;
}

int main()
{
	int ret = check_sys();
	if(ret == 1)
		cout<<"小端"<<endl;
	else
		cout << "大端" << endl;
	return 0;
}

思路是什么呢

我们用char* 强转a的地址,解引用一个字节,如果拿到的是1,代表是小端存储,图上清晰明了很简单

做题之前我们介绍一个东西
整形家族有这么多类型,我们怎么判断数据在内存的存储呢 在vs上我们认为没有unsigned就是有符号类型,有unsigned就是无符号类型,有符号类型第一位存储符号位(整数是0,负数是1),无符号类型每一位都是数值位,一个字节等于8比特位,具体的计算过程上图很明显了(注意:有符号类型第一位符号位不参与计算,只算数值位,所以相对无符号类型的最大值会小一半)
有符号数最高位是1整型提升高位补充符号位1,最高位是0整型提升高位补充符号位0
无符号数整型提升高位补0
1. // 输出什么? #include <stdio.h> int main () {     char a = - 1 ;     signed char b =- 1 ;     unsigned char c =- 1 ;     printf ( "a=%d,b=%d,c=%d" , a , b , c );//-1 -1 255     return 0 ; } 先算出补码,后截断,再根据类型整型提升,最后打印(以有符号打印需要看最高位,是1说明是负数,需要转化为原码,是0直接打印,以无符号打印直接补码就是原码,所有位都是数值位并且计算)

#include <stdio.h>
int main()
{
	char a = -1;
	//10000000000000000000000000000001
	//11111111111111111111111111111110
	//11111111111111111111111111111111-截断
	//11111111 -a
	//11111111111111111111111111111111
	//11111111111111111111111111111110
	//10000000000000000000000000000001--> -1

	signed char b = -1;
	//11111111111111111111111111111111
	//11111111 -b

	unsigned char c = -1;
	//11111111 -c
	//00000000000000000000000011111111
	//
	printf("a=%u,b=%u,c=%u", a, b, c);
	//%d - 十进制的形式打印有符号整型整数
	//整型提升

	return 0;
}
2. #include <stdio.h> int main () {     char a = - 128 ;     printf ( "%u\n" , a );//%u是以十进制形式打印无符号整数     return 0 ; }
//#include <stdio.h>
//int main()
//{
//	char a = -128;
//	//-128
//	//10000000000000000000000010000000//原码
//	//11111111111111111111111101111111//反码
//	//11111111111111111111111110000000//补码
//	//-128的补码
//	//10000000//截断
//	//11111111111111111111111110000000//有符号最高位补1,进行整型提升
//	//
//	printf("%u\n", a);
//	return 0;
//}

打印42亿多

3. #include <stdio.h> int main () {     char a = 128 ;     printf ( "%u\n" , a );     return 0 ; }//这道题跟上边的题结果一样因为截断处都是1000 0000,都是有符号数,以无符号形式打印,所以结果都一样
4. int i = - 20 ; unsigned   int   j = 10 ; printf ( "%d\n" , i + j ); // 按照补码的形式进行运算,最后格式化成为有符号整数
//int main()
//{
//	int i = -20;
//	//10000000000000000000000000010100
//	//11111111111111111111111111101011
//	//11111111111111111111111111101100//-20的补码
//	//
//	unsigned int j = 10;
//	//00000000000000000000000000001010//10的补码
//	//11111111111111111111111111101100
//	//11111111111111111111111111110110//相加和是补码,要以有符号形式打印,转化为原码
//	//11111111111111111111111111110101
//	//10000000000000000000000000001010 -10//转化为原码

//	printf("%d\n", i + j);//-10
//	return 0;
//}
//
5. unsigned int i ; for ( i = 9 ; i >= 0 ; i -- ) {     printf ( "%u\n" , i ); } 因为i是无符号整形,所以--到0之后会是42亿多,-1的补码是32位全1,所以是42亿多
6. int main () {    char a [ 1000 ]; int i ;    for ( i = 0 ; i < 1000 ; i ++ )   {        a [ i ] = - 1 - i ;   }     printf ( "%d" , strlen ( a ));   return 0 ; } char是有符号char,最多表示-128到127,所以数组里边只会存连续相同的,-1到-128,再从127到0,这是一轮循环,因为\0的ascll码值是0,所以strlen到第一轮0就会结束,0之前是255个字符,所以打印255
7.
#include <stdio.h>
unsigned char i = 0;
int main()
{
    for(i = 0;i<=255;i++)
   {
        printf("hello world\n");
   }
    return 0;
}

这个就很简单了,无符号char范围是0~255,只要进入循环i永远小于255,所以死循环

浮点型在内存中的存储

常见的浮点数: 3.14159 1E10 浮点数家族包括: float 、 double 、 long double 类型。 浮点数表示的范围: float.h 中定义
浮点数存储的例子:
#include<iostream>
using namespace std;
#include <stdio.h>

int main()
{
	int n = 9;
	//
	//0 00000000 00000000000000000001001
	//S  E        M
	//0  -126     0.00000000000000000001001
	//(-1)^0 * 0.00000000000000000001001 * 2^-126
	//
	//E在内存中是全0
	//
	float* pFloat = (float*)&n;

	printf("n的值为:%d\n", n);//9
	printf("*pFloat的值为:%f\n", *pFloat);//0.000000

	*pFloat = 9.0;
	//1001.0
	//1.001 * 2^3
	//(-1)^0 * 1.001 * 2^3
	//S=0     E=3  M=1.001
	//0 10000010 00100000000000000000000
	//
	printf("num的值为:%d\n", n);//1091567616
	printf("*pFloat的值为:%f\n", *pFloat);//9.0

	return 0;
}
 

先把这个代码放在这,过程已经写过了,现在要描述一下浮点数如何在内存存储

对于 64 位的浮点数,最高的 1 位是符号位, 接着的 11 位是指数 E ,剩下的 52 位为有效数字 M 。

第一个是float,第二个是double

下边有点长,我把关键部分加粗了,理解起来轻松些

浮点数存储规则 num 和 *pFloat 在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大? 要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。 详细解读:根据国际标准IEEE (电气和电子工程协会) 754 ,任意一个二进制浮点数 V 可以表示成下面的形式: (-1)^S * M * 2^E (-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。 M表示有效数字,大于等于1,小于2。 2^E表示指数位。 举例来说: 十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。 那么,按照上面 V 的格式,可以得出 S=0 , M=1.01 , E=2 。 IEEE 754 对有效数字 M 和指数 E ,还有一些特别规定。 前面说过, 1≤M<2 ,也就是说, M 可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。 IEEE 754 规定,在计算机内部保存 M 时,默认这个数的第一位总是 1 ,因此可以被舍去,只保存后面的xxxxxx部分。比如保存 1.01 的时候,只保存01 ,等到读取的时候,再把第一位的 1 加上去。这样做的目的,是节省 1 位有效数字。以 32 位浮点数为例,留给M 只有 23 位,将第一位的1 舍去以后,等于可以保存 24 位有效数字。(提高数字的精度,意思就是说M只存小数位,不够补0) 至于指数 E ,情况就比较复杂。 首先, E 为一个无符号整数( unsigned int 这意味着,如果 E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047 但是,我们知道,科学计数法中的E 是可以出现负数的,所以IEEE 754 规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间 数是1023 。比如, 2^10 的 E 是 10 ,所以保存成 32 位浮点数时,必须保存成 10+127=137 ,即 10001001 。然后,指数E 从内存中取出还可以再分成三种情况: E 不全为 0 或不全为 1(绝大多数情况,意思就是说怎么放进去怎么拿出来),(放进去+127/1023,拿出来-127/1023) 这时,浮点数就采用下面的规则表示,即指数 E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。 比如: 0.5( 1/2 )的二进制形式为 0.1 ,由于规定正数部分必须为 1 ,即将小数点右移 1 位,则为 1.0*2^(-1),其阶码为 -1+127=126 ,表示为01111110,而尾数 1.0 去掉整数部分为 0 ,补齐 0 到 23 位 00000000000000000000000 ,则其二进制表示形式为: 00111111000000000000000000000000 E全为0(说明放进去之前是0-127/1023,表示为2^-127/2^-1023,是一个很小的值,可以忽略不计了)(这种情况了解一下就行) 这时,浮点数的指数 E等于1-127(或者1-1023 )即为真实值,有效数字M 不再加上第一位的 1 ,而是还原为 0.xxxxxx 的小数。这样做是为了表示 ±0 ,以近于0的很小的数字。 E 全为 1(说明放进去之前是127/,反正是一个很大的值,也不做重点讨论,了解) 这时,如果有效数字 M 全为 0 ,表示 ± 无穷大(正负取决于符号位 s ); 好了,关于浮点数的表示规则,就说到这里。
有了上边的基础,下边这道题就很好理解了
#include <stdio.h>
int main()
{
	float f = 5.5;
	//101.1是2进制的5.5
	//1.011 * 2^2,将2进制类比位10进制进行表示很简单
	//(-1)^0 *1.011 * 2^2//将对应的数值填入表达式中
	//S = 0
	//M = 1.011
	//E = 2
	//0100 0000 1011 0000 0000000000000000
	//0x40b00000
	return 0;
}

对照上边的浮点数存储模型,5.5是单精度浮点数,对照单精度存储结构,S=0,M=1.011,E=2

S第一个位置就填0,E为2放进去要加127是129,二进制是10000001 ,小数点后边有三位是011,M有23比特位,011后边全补0二进制序列就没毛病了,上边我写的也有

换算成16进制是0x40b00000

可以很清晰的看到内存中是小端存储,我们算的是对的,只要按照这个算法99%的浮点数我们都会算。

理解完了这道题,我们还要再看一下刚才那道题

注意,我们以整形存进去并且以整形往出拿,和以浮点型存进去并且以浮点型往出拿的结果都很单纯,以整形存进去但以浮点数往出拿和以浮点数存进去以整形往出拿的结果大大不同。

#include<iostream>
using namespace std;
#include <stdio.h>

int main()
{
	int n = 9;
	//
	//0 00000000 00000000000000000001001
	//S  E        M
	//0  -126     0.00000000000000000001001
	//(-1)^0 * 0.00000000000000000001001 * 2^-126
	//
	//E在内存中是全0
	//
	float* pFloat = (float*)&n;

	printf("n的值为:%d\n", n);//9
	printf("*pFloat的值为:%f\n", *pFloat);//0.000000

	*pFloat = 9.0;
	//1001.0
	//1.001 * 2^3
	//(-1)^0 * 1.001 * 2^3
	//S=0     E=3  M=1.001
	//0 10000010 00100000000000000000000
	//
	printf("num的值为:%d\n", n);//1091567616
	printf("*pFloat的值为:%f\n", *pFloat);//9.0

	return 0;
}

整数n在内存中正常存储,原码反码补码相同,注意,我们计算的永远是内存中的补码,打印打的是内存中的原码,当把整数int类型以浮点数形式往出拿的时候,根据国际标准IEEE(电气和电子工程协会) 754标准,将内存以SME表示出来,S是0,E是全0,我们刚才说过E是全0,说明我们拿出来是E是-126,M就是0.00000000000000000001001。可以看到,只要根据公式计算,就很简单。

当我们以浮点数的形式存进去,以整数形式拿出来,9.0二进制表示为1001.0,科学计数法是10001*2^3,根据IEEE协会标准算出来S E M分别是多少,再以刚才的规则将其填进去,最后以有符号形式打印,符号位是0,以整数打印,整数的原码反码补码相同,将其以原码形式打印出来就是10亿这个数字。很简单吧

以上就是我对数据类型以及数据存储的介绍,感谢支持!!!以后会创作更多的文章

标签:存储,符号,int,浮点数,补码,内存,数据,原码
From: https://blog.csdn.net/eixjdj/article/details/145092482

相关文章

  • 低代码系统-数据规则介绍(表单设计器)
            数据规则作为数据模型中的核心模块,在业务配置和流转过程中有着举足轻重的作用,有了数据规则,表单的操作可以得到限制和拓展。例如:请假时间不可能选到过去,当请假人在请假时应当限制时间范围。    当不同的人和不同的流程过程中,操作表单时,可以操作和看到......
  • AccessData FTK Imager 是一款由 AccessData 公司开发的数字取证工具,用于创建计算机系
    AccessDataFTKImager是一款由AccessData公司开发的数字取证工具,用于创建计算机系统和存储设备的完整数据镜像,并且支持从中提取和分析数据。它是一款非常流行的取证软件,尤其在计算机取证、数据恢复和法律领域应用广泛。FTKImager的主要功能:创建数据镜像:FTKImager可以......
  • PCIe总线-存储器域和PCIe总线域访问流程分析(二)
    1.概述PCIe总线的最大特点是像CPU访问DDR一样,可以直接使用地址访问PCIe设备(桥),但不同的是DDR和CPU同属于存储器域,而CPU和PCIe设备属于两个不同的域,PCIe设备(桥)的地址空间属于PCIe总线域。存储器域访问PCIe总线域或者PCIe总线域访问存储器域,需要经过一系列的转换才可以完成。2.跨域......
  • 读数据保护:工作负载的可恢复性31读后总结与感想兼导读
    1. 基本信息读数据保护:工作负载的可恢复性[美]W.柯蒂斯·普雷斯顿(W.CurtisPreston)著机械工业出版社,2023年3月出版1.1. 读薄率书籍总字数482千字,笔记总字数99991字。读薄率99991÷482000≈20.7%1.2. 读厚方向DataMesh权威指南数据的边界:隐私与个人数据......
  • Jot:方便.Net开发者状态和应用数据持久化的开源库
    C#开源工具为了提升用户体验,特别是一些应用桌面软件,我们会记住窗口的大小、最后点击的选项卡、窗口布局等一些数据,方便下一次软件启动的时候,恢复到最后的状态。下面推荐一个开源库,方便我们来实现这个功能,以及实现任何状态和应用数据持久化。 01项目简介Jot是一个开源的.NET......
  • 数据结构入门
    数据结构数据结构分为顺序表,链表,栈,队列,堆,树,图顺序表顺序表的物理结构和逻辑结构都是连续的去建立一个顺序表,我们需要先去了解底层是什么。在脑海中很容易就会联想到数组,所以创建一个顺序表,首先要有一个数组。但是仅仅有数组是不够的,我们需要在其中对数据进行处理,那么其有......
  • 跟我一起学 Python 数据处理(三十五):数据获取与存储的关键要点
    跟我一起学Python数据处理(三十五):数据获取与存储的关键要点在数据处理的领域中,我们不断探索前行,今天的目标是深入了解数据获取与存储方面的知识,希望能与大家共同提升这方面的技能,一起在数据处理的道路上迈出坚实的步伐。一、文章写作初衷在数据的世界里,获取高质量、可靠......
  • 跟我一起学 Python 数据处理(三十四):进阶文件类型处理与技巧
    跟我一起学Python数据处理(三十四):进阶文件类型处理与技巧在数据的海洋中,我们常常会遇到各种各样的文件类型,而Python作为强大的数据处理工具,能够帮助我们应对诸多挑战。今天,我们继续深入学习Python数据处理的相关知识,希望能与大家共同进步,更好地掌握数据处理的技能。......
  • 音视频:JavaCV 两种摄像头视频数据采集的方法
    需要进行简单的音视频编程,如果不是特别熟悉C/C++,那么JavaCV应该是比较好的选择,下面记录一下使用JavaCV采集摄像头的两种方法。1.OpenCV使用OpenCVFrameGrabber采集指定摄像头(索引)的视频数据:publicclassSample01_Camera{ publicstaticvoidmain(String[]args)throwsEx......
  • 浅析人工智能机器人学之运动控制与感知:机器人运动规划、传感器数据处理
    人工智能机器人学之运动控制与感知:机器人运动规划、传感器数据处理机器人学(Robotics)是人工智能(AI)最为重要且富有挑战性的应用领域之一。在这一领域,机器人需要能够与物理世界进行有效交互,以完成任务并确保操作的精确性与安全性。为了实现这一目标,机器人学结合了多个子领域,其中......