文章目录
一、为什么有动态内存分配
我们之前已经学过一些开辟内存的方法,就是创建变量时,操作系统给我们分配的空间,而内存大致分为以下3个大部分,如图:
我们创建局部变量或者是创建函数的形参时,就是在栈区开辟空间,如下:
//在栈空间上开辟四个字节
int val = 20;
//在栈空间上开辟10个字节的连续空间
char arr[10] = {0};
当我们创建的是全局变量或者是static修饰的静态变量时,就是在静态区开辟了空间,如下:
//在静态区开辟一个字节的空间
char c = 'a';//全局变量
//在静态区开辟四个字节的空间
static int val = 20;
但是上述的开辟空间的方式有两个特点:
- 空间开辟大小是固定的
- 数组在申明的时候,必须指定数组的长度度,数组空间⼀旦确定了大小不能调整
但是对于空间的需求,不仅仅是上述的情况。有时候我们需要的空间大小在程序运行的时候才能知道,那数组的编译时开辟空间的方式就不能满足了
C语⾔引⼊了动态内存开辟,让程序员⾃⼰可以申请和释放空间,就⽐较灵活了,而动态内存开辟的空间属于堆区,本文我们就详细介绍一下动态内存管理相关的函数和知识点
二、malloc和free
C语言的动态内存分配是通过库函数实现的,该节我们就来讲解其中的malloc函数和free函数的作用及用法,使用这两个库函数需要包含头文件<stdlib.h>
1.malloc函数的使用
malloc函数向内存的堆区申请⼀块连续可用的空间,并返回指向这块空间的指针,我们来看看malloc的原型,并简单分析一下:
void* malloc (size_t size);
它的参数是一个无符号的size,它的单位是字节,就是在堆区开辟size个字节的空间,这个点要特别注意,很容易搞混
它的返回值是void*,返回的是开辟的空间的首地址,是一个没有类型的指针,为什么这么设计呢?因为不知道我们申请的空间到底是存放整型,还是字符型,或者说浮点型等等,所以设计成void*可以通用,在使用时我们就通过强制类型转换来对它进行改变
当然上面说的都是开辟成功的情况,如果malloc开辟空间失败了,那么就会返回一个NULL空指针
接下来我们来总结一下malloc的特点:
- 如果开辟成功,则返回⼀个指向开辟好空间的指针
- 如果开辟失败,则返回⼀个 NULL 指针,因此malloc的返回值⼀定要做检查
- 返回值的类型是 void* ,因为malloc函数并不知道开辟空间的类型,具体在使⽤的时候使⽤者⾃⼰来决定
- 如果参数 size 为0,malloc的⾏为是标准是未定义的,取决于编译器
接下来我们举个例子来具体看看malloc怎么开辟空间的,就是用malloc来模拟实现数组的功能
这个例子需要动脑袋好好思考,在数据结构的顺序表有类似用法,只不过是realloc,接下来我们先写出代码再来分析:
#include <stdio.h>
#include <stdlib.h>
int main()
{
int* arr = (int*)malloc(5 * sizeof(int));
if (arr == NULL)
{
perror("malloc");
return 1;
}
for (int i = 0; i < 5; i++)
{
arr[i] = i + 1;
printf("%d ", arr[i]);
}
return 0;
}
首先我们创建了一个整型指针arr,表示这个模拟的数组的首地址,由于malloc开辟的空间是连续的,所以我们申请完空间后就可以把这段空间当成数组来使用
注意malloc的参数的单位是字节,所以不能直接写5,那是元素个数,要求到最后的字节数,需要元素个数乘以每个元素的大小,并且注意malloc的返回值是void类型的,这里我们需要int的指针就强制转换一下
当然,我们要判断一下malloc放回的是否是空指针NULL,如果返回的是空指针,那么说明malloc开辟空间失败了,我们就需要打印一下开辟失败的原因,然后给出一个错误返回,结束程序,这是一个好习惯,我们可以在每次开辟空间时都判断一下,避免出错
如果不会perror函数的,可以参考文章:【C语言】字符和字符串函数(2)
随后malloc就帮我们在堆区开辟了5个连续的整型空间,就跟我们的数组一样,只是数组的空间一般在栈区开辟,接着我们就可以把arr当作5个元素的整型数组使用,其中arr是首地址,我们来看看代码运行结果:
可以看到代码很好地跑了起来,说明我们用指针和malloc实现了模拟数组的功能,那么是不是使用malloc函数申请完空间就不管了吗?我们接着学习下一个函数:free
2.free函数的使用
当我们使用内存函数开辟了空间,然后进行使用,使用完后这块空间是否会自动还给操作系统呢?是不会的,如果不释放,那么我们写的程序就会一直占用这段空间,无法让其他程序利用
所以当我们使用内存函数开辟了空间,使用完毕要手动的把这段空间释放了,否则会造成空间浪费,而free函数就是用来释放内存空间的函数,它的原型如下:
void free (void* ptr);
它没有返回值,参数是一个未知类型的指针,free的作用就是从这个指针的地址开始从后释放我们开辟的空间
以下是它的两个需要注意的点:
- 如果参数 ptr 指向的空间不是动态开辟的,那free函数的⾏为是未定义的
- 如果参数 ptr 是NULL指针,则函数什么事都不做
所以根据以上的描述,我们之前写的用指针和malloc模拟实现数组的代码还有点问题,就是我们使用malloc开辟了空间,但是没有释放掉,所以接下来我们就接着它继续写:
#include <stdio.h>
#include <stdlib.h>
int main()
{
int* arr = (int*)malloc(5 * sizeof(int));
if (arr == NULL)
{
perror("malloc");
return 1;
}
for (int i = 0; i < 5; i++)
{
arr[i] = i + 1;
printf("%d ", arr[i]);
}
free(arr);
arr = NULL;
return 0;
}
我们将arr占用的空间释放掉后,arr实际上还是有值,存放的是之前空间的地址,free是释放掉空间了,不会改变arr里面存储的地址
所以此时arr存放的地址所指向的内容已经还给操作系统了,它指向那个位置没有作用,成了野指针,所以为了避免野指针,我们最后可以把arr置为空指针NULL,这样降低我们的代码的出错率
三、calloc和realloc
1.calloc函数的使用
calloc函数也是用来开辟空间的,只是使用方式和malloc有一点不同,效果都是一致的,我们来看看它的原型:
void* calloc (size_t num, size_t size);
它的返回值和malloc的含义一致,这里就不多讲了,我们主要来看看它的参数,它的参数和malloc有些不同,malloc只有一个参数,就是要开辟空间的字节数
而calloc有两个参数,num是我们要开辟的元素的个数,size是开辟一个元素占的字节数,malloc和calloc实际上可以互相转换写
比如我们刚刚使用malloc开辟了5个整型的空间,同样的我们可以使用calloc实现,如下:
int* arr = (int*)calloc(5, sizeof(int));
//等价于:
//int* arr = (int*)malloc(5 * sizeof(int));
但是calloc和malloc还有一个比较大的区别,就是calloc开辟后的空间会把每个字节直接初始化为0,而malloc不会,我们来测试一下:
#include <stdio.h>
#include <stdlib.h>
int main()
{
int* arr = (int*)calloc(5 , sizeof(int));
if (arr == NULL)
{
perror("calloc");
return 1;
}
for (int i = 0; i < 5; i++)
{
printf("%d ", arr[i]);
}
free(arr);
arr = NULL;
return 0;
}
我们来看看代码运行结果:
可以看到,我们没有对arr这段空间做修改,只是使用了calloc来开辟空间,所以我们也可以得出,是calloc在开辟空间时,自动把开辟的空间初始化为0了
我们最后总结一下calloc的特点:
- 函数的功能是为 num 个⼤⼩为 size 的元素开辟⼀块空间,并且把空间的每个字节初始化为0。
- 与函数 malloc 的区别只在于 calloc 会在返回地址之前把申请的空间的每个字节初始化为全
0
2.realloc函数的使用
有了前面两个函数来让程序员开辟空间确实增加了灵活性,但是一旦空间被开辟了也就被确定了,还是不能动态的根据需要申请空间,所以我们就有了另一个函数:realloc
它可以对malloc或者是calloc开辟的空间进行增容,它的出现也让动态内存开辟更加灵活
接下来我们来看看它的原型:
void* realloc (void* ptr, size_t size);
我们先来看看参数,第一个参数是一个指针,它就是我们要增容的空间的地址,第二个参数就是我们要增容多少字节,这两个参数还是比较好理解,关键在于它的返回值
它的返回值是返回我们增容后的空间的首地址,但是会有两种情况:
-
当我们原空间后面的空间足够增容时,那么它返回的就是原空间的地址,如图:
此时我们要增容的空间比未分配的空间小,那么realloc就会直接在ptr的尾巴后面继续开辟空间,保持ptr空间的内容不变然后返回的也是ptr -
但是还有另一种情况,就是我们需要增容的空间比未分配的空间大,那么它就会找另一个可以把原空间和增容空间一起放下的地方,把它们放进去,如图:
此时我们开辟的空间就不再是从原来空间开始了,所以返回的就是这个新空间的首地址ptr2,也就不是原来的ptr了,然后原空间的数据会被拷贝到新空间中
但是需要注意的一点是,如果realloc增容空间失败会返回空指针NULL,所以我们在使用realloc函数的时候就要比malloc和calloc小心一点,不能直接用ptr来接收realloc的返回值
因为malloc和calloc都是第一次开辟空间,此时没有数据存储在空间中,就算返回NULL指针也可以,但是realloc是增容空间,原空间是有数据的,如果realloc开辟空间失败了,那么此时ptr就是空指针,不仅增容失败了,之前的数据也找不到了
所以我们在接收realloc的返回值时,可以创建一个临时指针,然后判断它是否为空,不为空再把这个临时指针赋值给我们的ptr
我们还是以指针模拟数组那个例子来讲,现在我们觉得5个整型空间不够了,要再增容5个整型空间的方法如下:
#include <stdio.h>
#include <stdlib.h>
int main()
{
int* arr = (int*)malloc(5 * sizeof(int));
if (arr == NULL)
{
perror("malloc");
return 1;
}
//使用空间·····
//空间不够了,增容:
int* tmp = (int*)realloc(arrr, 5 * sizeof(int));
if(tmp == NULL)
{
perror("realloc");
return 1;
}
arr = tmp;
//使用增容空间,使用完毕后释放:
free(arr);
arr = NULL;
return 0;
}
最后我们再总结一下realloc可能会出现的两种情况:
- 当是情况1 的时候,要扩展内存就直接原有内存之后直接追加空间,原来空间的数据不发⽣变化
- 当是情况2 的时候,原有空间之后没有⾜够多的空间时,扩展的⽅法是:在堆空间上另找⼀个合适大小的连续空间来使⽤,这样函数返回的是⼀个新的内存地址
四、常见动态内存分配的错误
- 对NULL指针的解引⽤操作:由于开辟空间的函数malloc、calloc和realloc如果开辟失败都会返回空指针,这时对它解引用就会造成错误,所以我们在使用前一定要判断一下它们返回的地址是否是空指针
- 对动态开辟空间的越界访问:由于我们使用malloc或者calloc的时候开辟的空间还是固定的,比如开辟了10个整型,那么就只能使用10个整型,所以如果使用第11个整型的空间,那么程序就会报越界访问的错误
- 对⾮动态开辟内存使⽤free释放:这样的操作是C语言标准未定义的,不同的编译器可能有不同的处理结果,也可能报错,所以如果没有使用动态内存开辟函数开辟空间,那么就不要使用free函数
- 动态开辟内存忘记释放(内存泄漏):由于动态开辟的内存操作系统不会主动收回,所以即使我们不使用那些空间了,也会一直占用内存空间,如果大量动态开辟的空间占据了内存,那么就会造成内存泄漏
五、动态内存经典笔试题
题1
运行以下代码会发生什么?
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
void GetMemory(char* p)
{
p = (char*)malloc(100);
}
int main()
{
char* str = NULL;
GetMemory(str);
strcpy(str, "hello world");
printf(str);
return 0;
}
我们来分析一下这个代码,它想表达的就是,创建一个指针来看作字符串首地址,然后以它为基础使用GetMemory函数开辟内存空间,然后将hello world放入这个空间中,最后打印出来
那么这个函数真的实现了这样的效果了吗?我们来看看运行结果:
我们惊讶地发现程序居然什么都没有打印,这是为什么?有经验的人可能一眼就看出来了,问题就出在GetMemory函数的传参上,这里我们将str传了过去,使用p来接收,str和p都是同样的类型,通过p不能修改str,也就是说不能通过p为str开辟空间
我们也可以从实参形参的角度理解,str是形参,p是实参,我们给p申请了空间,但是由于形参不会影响实参,所以实参str并没有开辟空间,也就没有把hello world放进空间,自然打印不出来它
那我们要怎么做呢?要想修改str,为str开辟空间,那么我们传参时必须传高一级的参数,比如我们想要修改整型变量a,那么就要传a的地址,通过a的地址修改a
这里也是一样,我们要修改一级指针str,就要传一级指针str的地址,也就是一个二级地址过去,通过这个二级地址解引用来修改一级指针str,为它开辟空间,如下代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
void GetMemory(char** p)
{
p = (char*)malloc(100);
}
int main()
{
char* str = NULL;
GetMemory(&str);
strcpy(str, "hello world");
printf(str);
return 0;
}
我们来看看运行结果:
可以看到,这样写才能实现我们的目的,这个题给了我们一个启发,就是遇到函数传参一定要小心,搞清楚是传值还是传地址
最后还有两点,也是最不容易发现的,一个就是malloc的返回值需要判断是否为空指针,还有一个更严重的问题是,使用了malloc却没有free,这是我们讲过的错误之一:内存泄漏
所以这个代码最好还要加上这两个步骤,这里我就不写了,可以自行加上
题2
运行以下代码会发生什么?
#include <stdio.h>
#include <stdlib.h>
char* GetMemory(void)
{
char p[] = "hello world";
return p;
}
int main()
{
char* str = NULL;
str = GetMemory();
printf(str);
return 0;
}
做了练习1,我们看练习2就很眼熟了,可能也就猜到了是函数的问题,没错,这道题也是函数有问题,其实考点还是函数那一章,放在这里是呼应练习1
它的考点就是函数内部的变量属于这个函数的栈帧,当函数调用结束时,会回收空间,也就是会销毁函数中的变量
那么这里让p数组存放hello world,但是函数结束就把它释放掉了,那么最后返回的指针指向的空间就是已经被释放的空间,也就是野指针,所以最后打印的结果是未知的
我们来看看运行结果:
题3
运行以下代码会发生什么?
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main()
{
char* str = (char*)malloc(100);
strcpy(str, "hello");
free(str);
if (str != NULL)
{
strcpy(str, "world");
printf(str);
}
return 0;
}
这个代码的问题很容易发现,一个是对malloc的返回值进行判断,这个就不说了,更大的问题在于free,我们走到free时,就把我们的str的空间给释放了,但是后面却没有给它置为空指针NULL
而是给它重新拷贝值,这是我们讲过的错误之一:非法访问,在free(str)执行后,str就成了野指针,所以后面的拷贝就是非法访问
六、总结C/C++中程序内存区域划分
在动态内存管理的最后,我们将C/C++中程序内存区域划分拿来总结一下C/C++程序内存分配的⼏个区域:
- 栈区(stack):在执⾏函数时,函数内局部变量的存储单元都可以在栈上创建,函数执⾏结束时这些存储单元⾃动被释放。栈内存分配运算内置于处理器的指令集中,效率很⾼,但是分配的内存容量有限。 栈区主要存放运行函数而分配的局部变量、函数参数、返回数据、返回地址等
- 堆区(heap):⼀般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 ,分配⽅式类似于链表,
- 数据段(静态区):(static)存放全局变量、静态数据,程序结束后由系统释放
- 代码段:存放函数体(类成员函数和全局函数)的⼆进制代码
分析图如下:
今天的分享就到此结束,在说再见之前告诉大家一件事,就是我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=34m59s418000k
如果有什么疑问欢迎在评论区提出,bye~