首页 > 系统相关 >进程空间管理:用户态和内核态

进程空间管理:用户态和内核态

时间:2024-09-21 22:50:59浏览次数:3  
标签:映射 vm 用户 start brk 内核 进程 内存

用户态虚拟空间里面有几类数据,例如代码、全局变量、堆、栈、内存映射区等。在 struct mm_struct 里面,有下面这些变量定义了这些区域的统计信息和位置。

unsigned long mmap_base;  /* base of mmap area */
unsigned long total_vm;    /* Total pages mapped */
unsigned long locked_vm;  /* Pages that have PG_mlocked set */
unsigned long pinned_vm;  /* Refcount permanently increased */
unsigned long data_vm;    /* VM_WRITE & ~VM_SHARED & ~VM_STACK */
unsigned long exec_vm;    /* VM_EXEC & ~VM_WRITE & ~VM_STACK */
unsigned long stack_vm;    /* VM_STACK */
unsigned long start_code, end_code, start_data, end_data;
unsigned long start_brk, brk, start_stack;
unsigned long arg_start, arg_end, env_start, env_end;

其中,total_vm 是总共映射的页的数目。我们知道,这么大的虚拟地址空间,不可能都有真实内存对应,所以这里是映射的数目。当内存吃紧的时候,有些页可以换出到硬盘上,有的页因为比较重要,不能换出。locked_vm 就是被锁定不能换出,pinned_vm 是不能换出,也不能移动。

data_vm 是存放数据的页的数目,exec_vm 是存放可执行文件的页的数目,stack_vm 是栈所占的页的数目。

start_code 和 end_code 表示可执行代码的开始和结束位置,start_data 和 end_data 表示已初始化数据的开始位置和结束位置。

start_brk 是堆的起始位置,brk 是堆当前的结束位置。前面咱们讲过 malloc 申请一小块内存的话,就是通过改变 brk 位置实现的。

start_stack 是栈的起始位置,栈的结束位置在寄存器的栈顶指针中。

arg_start 和 arg_end 是参数列表的位置, env_start 和 env_end 是环境变量的位置。它们都位于栈中最高地址的地方。

mmap_base 表示虚拟地址空间中用于内存映射的起始地址。一般情况下,这个空间是从高地址到低地址增长的。前面咱们讲 malloc 申请一大块内存的时候,就是通过 mmap 在这里映射一块区域到物理内存。咱们加载动态链接库 so 文件,也是在这个区域里面,映射一块区域到 so 文件。

这下所有用户态的区域的位置基本上都描述清楚了。整个布局就像下面这张图这样。虽然 32 位和 64 位的空间相差很大,但是区域的类别和布局是相似的。

进程空间管理:用户态和内核态_物理内存

堆是从低地址向高地址增长的,sys_brk 函数的参数 brk 是新的堆顶位置,而当前的 mm->brk 是原来堆顶的位置。

首先要做的第一个事情,将原来的堆顶和现在的堆顶,都按照页对齐地址,然后比较大小。如果两者相同,说明这次增加的堆的量很小,还在一个页里面,不需要另行分配页,直接跳到 set_brk 那里,设置 mm->brk 为新的 brk 就可以了。

如果发现新旧堆顶不在一个页里面,麻烦了,这下要跨页了。如果发现新堆顶小于旧堆顶,这说明不是新分配内存了,而是释放内存了,释放的还不小,至少释放了一页,于是调用 do_munmap 将这一页的内存映射去掉。

如果堆将要扩大,就要调用 find_vma。如果打开这个函数,看到的是对红黑树的查找,找到的是原堆顶所在的 vm_area_struct 的下一个 vm_area_struct,看当前的堆顶和下一个 vm_area_struct 之间还能不能分配一个完整的页。如果不能,没办法只好直接退出返回,内存空间都被占满了。

如果还有空间,就调用 do_brk 进一步分配堆空间,从旧堆顶开始,分配计算出的新旧堆顶之间的页数。

内核态的虚拟空间和某一个进程没有关系,所有进程通过系统调用进入到内核之后,看到的虚拟地址空间都是一样的。

在内核态,32 位和 64 位的布局差别比较大,主要是因为 32 位内核态空间太小了。32 位的内核态虚拟地址空间一共就 1G,占绝大部分的前 896M,我们称为直接映射区。

进程空间管理:用户态和内核态_直接映射_02

所谓的直接映射区,就是这一块空间是连续的,和物理内存是非常简单的映射关系,其实就是虚拟内存地址减去 3G,就得到物理内存的位置。

  • __pa(vaddr) 返回与虚拟地址 vaddr 相关的物理地址;
  • __va(paddr) 则计算出对应于物理地址 paddr 的虚拟地址。

其实 64 位的内核布局反而简单,因为虚拟空间实在是太大了,根本不需要所谓的高端内存,因为内核是 128T,根本不可能有物理内存超过这个值。

进程空间管理:用户态和内核态_虚拟地址_03

64 位的内核主要包含以下几个部分。从 0xffff800000000000 开始就是内核的部分,只不过一开始有 8T 的空档区域。

从 __PAGE_OFFSET_BASE(0xffff880000000000) 开始的 64T 的虚拟地址空间是直接映射区域,也就是减去 PAGE_OFFSET 就是物理地址。虚拟地址和物理地址之间的映射在大部分情况下还是会通过建立页表的方式进行映射。

从 VMALLOC_START(0xffffc90000000000)开始到 VMALLOC_END(0xffffe90000000000)的 32T 的空间是给 vmalloc 的。从 VMEMMAP_START(0xffffea0000000000)开始的 1T 空间用于存放物理页面的描述结构 struct page 的。

从 __START_KERNEL_map(0xffffffff80000000)开始的 512M 用于存放内核代码段、全局变量、BSS 等。这里对应到物理内存开始的位置,减去 __START_KERNEL_map 就能得到物理内存的地址。这里和直接映射区有点像,但是不矛盾,因为直接映射区之前有 8T 的空当区域,早就过了内核代码在物理内存中加载的位置。

进程运行状态在 32 位下对应关系。

进程空间管理:用户态和内核态_虚拟地址_04

对于 64 位的对应关系,只是稍有区别。

进程空间管理:用户态和内核态_直接映射_05


标签:映射,vm,用户,start,brk,内核,进程,内存
From: https://blog.51cto.com/key3feng/12075505

相关文章

  • 27. 守护进程、进程间通信
    1.僵尸进程与孤儿进程 1.1前言在unix中,所有的子进程都是由父进程创建的,子进程再创建新的子进程子进程的结束和父进程的运行是一个异步的过程,即子进程运行完成时,父进程并不知道当子进程运行完成时,父进程需要调用wait()或waitpid()来获取子进程的运行状态1.2僵尸进程(1)概念......
  • 进程-管道
    管道定义    什么是管道                管道是Unix中最古老的进程间通信的形式。        我们把从一个进程连接到另一个进程的一个数据流称为一个“管道”                我们通常把是把一个进程的输出连接或“......
  • 基于微信小程序UNIAPP+Spring Boot+Vue+MySQL的多角色用户的高校毕业生离校管理系统
    目录前言 一、技术栈二、系统功能介绍三、核心代码1、登录模块 2、文件上传模块3、代码封装前言相比于以前的传统手工管理方式,智能化的管理方式可以大幅降低学校的运营人员成本,实现了高校毕业生离校管理的标准化、制度化、程序化的管理,有效地防止了高校毕业生离......
  • 乐观的 UI:改善前端应用程序的用户体验
    在前端开发中,最大的挑战之一是提供流畅、快速的用户体验。现代用户期望应用程序能够立即响应,没有延迟或中断。这就是乐观ui.的概念发挥作用的地方什么是乐观用户界面?乐观ui,或乐观用户界面,是一种开发技术,其中应用程序立即假设用户操作成功并相应地更新界面,甚至在收到服务......
  • 进程控制
    fork()执行完之后,返回值为什么父进程和子进程的pid变量会不同返回值?当fork()被调用时,操作系统会创建一个与父进程几乎相同的子进程,子进程会从fork()返回的位置开始执行。在子进程中,fork()返回值为0,表示它是新创建的进程。在父进程中,fork()返回子进程的PID,表示它是父......
  • Linux:进程(三)
    目录Linux源代码对进程的描述RSDTtXZ(进程僵尸)孤儿进程Linux源代码对进程的描述    理论上把进程状态大致被分为了:运行、阻塞、挂起。那么,在操作系统中具体是如何描述状态的。(有时候Linux内核也把进程称为任务)    Linux内核的源代码定义:/**The......
  • 怎么查看数据库的用户名和密码
    查看数据库的用户名和密码取决于你使用的数据库管理系统(DBMS)以及你所拥有的权限。以下是几种常见数据库系统中查看用户名和密码的方法:MySQL对于MySQL数据库,如果你有足够的权限,可以通过查询mysql.user表来查看用户列表及其相关信息。密码是以哈希形式存储的,不能直接读取明文密码......
  • 您在wp-config.php文件中提供的数据库用户名和密码可能不正确 的解决办法
    设置步骤复制配置文件在你的 htdocs 中的WordPress根目录下找到 wp-config-sample.php 文件。将 wp-config-sample.php 文件复制并重命名为 wp-config.php。编辑 wp-config.php 文件使用Notepad++或其他文本编辑器打开 wp-config.php 文件。修改以下......
  • 数据库连接错误:您在wp-config.php文件中提供的数据库用户名和密码可能不正确,或者无法
    为了解决“数据库连接错误”的问题,可以按照以下步骤进行操作:备份现有配置:在修改任何文件之前,请确保备份现有的wp-config.php文件,以防修改出错时能够恢复。重命名配置文件:将根目录下的wp-config-sample.php文件重命名为wp-config.php。这通常可以通过FTP客户端或通过服务器上......
  • 网站后台用户名和密码不对怎么办
    如果你遇到网站后台用户名和密码不正确的问题,可以尝试以下步骤来解决:检查输入:确认没有多余的空格。注意大小写是否正确。确认是否使用了正确的用户名(有些系统使用邮箱地址作为用户名)。重置密码:如果网站提供了“忘记密码”功能,请尝试使用此功能来重置密码。检查与网......