三、内存管理
3.1.1 内存的基础知识
知识总览
1.什么是内存,有何作用?
内存的定义:内存是用于存放数据的硬件。程序执行前需要先放到内存中才能被CPU处理。
如何区分各个程序的数据存放在什么位置?
给内存的存储单元编地址,内存地址从0开始,每一个地址对应一个存储单元
存储单元的大小:
如果计算机“按字节编址”,则每个存储单元大小为1字节,即1B,即8个二进制位
如果字长为16位的计算机“按字编址”,则每个存储单元大小为1个字;每个字的大小为16个二进制位
补充知识
1K=2^10
1M=2^20
1G=2^30
有的题目会告诉我们内存大小,让我们确定地址长度应该是多少?(即要多少个二进制位才能表示相应数目的存储单元)
例如一台4GB内存的手机,指的是该内存中可以存放4*(230)个字节。如果是按字节编址,则有4*(230)=232个存储单元,所以这么多的存储单元,需要232个地址,才能表示这么多的存储单元,所以地址需要用32个二进制位来表示(0~2^32-1)
2.进程的运行原理
进程由3个部分组成:程序段,数据段,PCB(进程控制块)
变量放在数据段,指令放在程序段
我们平常写的代码会翻译成CPU能识别的指令(例:00101100,00000011,01001111-数据传送指令)。这些指令会告诉CPU应该去内存的哪个地址存取数据,这个数据应该做什么样的处理。编译生成的指令一般是使用逻辑地址(相对地址)。
编译时产生的指令只关心“相对地址”,实际放入内存中再想办法根据进程的起始地址得到“绝对地址”
相对地址又称作逻辑地址,绝对地址又称作物理地址
3.从写程序到程序运行:
程序员编写源代码文件(*.c)----编译---->目标模块(*.o)----链接---->装入模块(可执行文件,*.exe)----装入---->内存
- 编译:由编译程序将用户源代码编译成若干个目标模块(编译就是把高级语言翻译为机器语言)
- 目标模块中所包含的指令中所包含的都是逻辑地址,这些逻辑地址都是从0开始的
- 链接:由链接程序将编译后的一组目标模块,以及所需库函数链接在一起,形成一个完整的装入模块
- 装入(装载):由装入程序将装入模块装入内存运行
4.装入模块装入内存的三种方式
(用三种不同的方法完成从逻辑地址到物理地址的转化)
- 绝对装入
- 静态重定位
- 动态重定位
绝对装入:
在编译时,如果事先知道程序将放到内存的哪个位置,编译程序将产生绝对地址的目标代码。装入程序按照装入模块中的地址,将程序和数据装入内存。
只适用于单道程序环境。
静态重定位:
称可重定位装入。编译,链接后的模块都是从0开始的,指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况,将装入模块装入到内存的适当位置。装入时对地址进行“重定位”,将逻辑地址变为物理地址(地址变换是在装入时一次完成的)
特点:在一个作业装入内存时,必须分配其要求的全部内存空间,如果没有足够的内存,就不能装入该作业。作业一旦进入内存后,在运行期间就不能再移动,也不能再申请内存空间。
动态重定位:
又称动态运行时装入。编译、链接后的装入模块的地址也都是从0开始的。装入程序把装入模块装入内存后,并不会立即把逻辑地址转换为物理地址,而是把地址转换推迟到程序真正要执行时才进行。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持。
5.链接的三种方式
- 静态链接:在程序运行之前,先将各目标模块及它们所需要的库函数连接成一个完整的可执行文件(装入模块),之后不再拆开。
- 装入时动态链接:将各目标模块装入内存时,边装入边链接的链接方式。
- 运行时动态链接:在程序执行中需要该目标模块时,才对它进行链接。其优点是便于修改和更新,便于实现对目标模块的共享。
3.1.2 内存管理的概念
1.操作系统负责内存空间的分配与回收
2.操作系统提供某种技术,在逻辑上对内存空间进行扩充
3.操作系统需要提供地址转换功能,实现程序的逻辑地址与物理地址的转换
- 绝对装入--单道程序阶段,无操作系统:编译时产生绝对地址
- 可重定位装入(静态重定位)--早期的多道批处理操作系统:装入时将逻辑地址转换为物理地址
- 动态运行时装入(动态重定位)--现代操作系统:运行时,将逻辑地址转换为物理地址,需要设置重定位寄存器
4.操作系统需要提供内存保护功能,保证各个进程在各自存储空间内运行,互不干扰
- 设置上下限寄存器,存放上下限地址,来限制进程对内存的访问,通过CPU来检查是否越界
- 设置重定位寄存器(基址寄存器)和界地址寄存器(限长寄存器)进行越界检查,重定位寄存器存放进程的起始物理地址,界地址寄存器存放进程的最大逻辑地址
3.1.3 覆盖与交换技术
1.覆盖技术
覆盖技术的思想:将程序分为多个段(多个模块),常用的段常驻内存,不常用的段在需要时调入内存。
内存中分为一个“固定区”和若干个“覆盖区”
需要常驻内存的段放在固定区中,调入后就不再调出(除非程序运行结束)
不常用的段放在“覆盖区”,需要时调入内存,不需要时调出内存。
缺点:必须由程序员声明覆盖结构(哪些模块是可以被覆盖的),操作系统自动完成覆盖。对用户不透明,增加用户编程负担。覆盖技术只用于早期的操作系统中,现在基本不适用。
2.交换技术
交换(对换)技术的思想:内存空间紧张时,系统将内存中某些进程暂时换到外存,把外存中的某些已具有运行条件的进程换入内存(进程在内存与磁盘间动态调度)
中级调度(内存调度):就是要决定将哪个处于挂起状态的进程重新调入内存。
暂时换出外存等待的进程状态为挂起状态(挂起态)
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
3.在外存的什么位置保存被换出的进程?
具有对换功能的操作系统中,通常把磁盘空间分为文件区和对换区两部分。文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配方式;对换区空间只占磁盘空间的小部分,被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度,因此对换区空间的管理主要追求换入换出速度,因此通常对换区采用连续分配方式。总之,对换区的I/O速度比文件区快。
4.交换通常发生在什么时候?
交换通常在许多进程运行且内存吃紧时进行,而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页,就说明内存吃紧,此时可以换出一些进程;如果缺页率明显下降,就可以暂停换出。
5.应该换出哪些进程?
可以优先换出阻塞进程;换出优先级低的进程;为了防止优先级低的进程在被调入后很快又被换出,有的系统还会考虑进程在内存的驻留时间。。。
注意:PCB会常驻内存,不会被换出外存
3.1.4连续分配管理方式
1.单一连续分配
在该分配方式中,内存被分为系统区和用户区。系统区通常位于内存的低地址部分,用于存放操作系统相关数据;用户区用于存放用户进程相关数据。内存中只能有一道用户程序,用户程序独占整个用户区空间。
优点:实现简单;无外部碎片,可以采用覆盖技术扩充内存;不一定需要采取内存保护。
缺点:只能用于单用户,单任务的操作系统;有内部碎片;存储利用率极低。
2.固定分区分配
将整个用户空间划分为若干个固定大小的分区,在每个分区只装入一道作业
固定分区分配
- 分区大小相等:缺乏灵活性,但是很适合用于用一台计算机控制多个相同对象的场合
- 分区大小不等:增加了灵活性,可以满足不同大小的进程需求。根据常在系统中运行的作业大小情况进行划分。
操作系统需要建立一个数据结构--分区说明表,来实现各个分区的分配与回收。每个表项建立一个分区,通常按分区大小进行排列。每个表项包括对应分区的大小、起始地址、状态(是否已分配)
当某用户程序要装入内存时,由操作系统内核程序根据用户程序大小检索该表,从中找到一个能满足大小的、未分配的分区,将之分配给该程序,然后修改状态为“已分配”。
优点:实现简单,无外部碎片
缺点:
- 用户程序太大时,可能所有分区都不能满足需求,此时只能用覆盖技术,但是会降低性能
- 也会产生内部碎片,内存利用率低
3.动态分区分配
又称可变分区分配。这种分配方式不会预先划分内存分区,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的
存在问题:
-
系统需要用什么样的数据结构记录内存你的使用情况?
常用的数据结构:
-
空闲分区表:每一个空闲分区对应一个表项。表中包含分区号,分区大小,分区起始地址等信息
分区号 分区大小(MB) 起始地址(M) 状态 1 20 8 空闲 2 10 32 空闲 3 4 60 空闲 -
空闲分区链:每个分区的起始部分和末尾部分分别设置前向指针和后向指针。起始部分处还可以记录分区大小等信息。
-
-
当很多个空闲分区都能满足需求时,应该选择哪个分区进行分配?
应该用最大的分区进行分配还是最小的分区进行分配?,或者是地址最低的部分进行分配?
按照一定的动态分区分配算法,从空闲分区表或者空闲分区链中选出一个分区分配给该作业。
-
如何进行分区的分配与回收操作?
分配:
如果将一个4MB的进程按照某个动态分区分配算法分配到第一个空闲分区
分区号 分区大小(MB) 起始地址(M) 状态 1 20 8 空闲 2 10 32 空闲 3 4 60 空闲
分区表将会由原来的上表变为下表
分区号 | 分区大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 16 | 12 | 空闲 |
2 | 10 | 32 | 空闲 |
3 | 4 | 60 | 空闲 |
如果将一个4MB的进程按照某个动态分区分配算法分配到最下面那个空闲分区
就会变为如下这样
分区号 | 分区大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 20 | 8 | 空闲 |
2 | 10 | 32 | 空闲 |
使用的是空闲分区链的数据结构的话,就需要把相应的结点删除
回收:
若回收的分区和原来空闲的分区相邻,需要将两个(或三个)分区合二为一,分区空闲表也进行相应的变化
动态分区分配没有内部碎片,但是有外部碎片
内部碎片:分配给某进程的内存区域中,有些部分没有用上。
已经被分配出去(能明确指出属于哪个进程)却不能被利用的内存空间;
外部碎片:是指内存中的某些分区由于太小而难以利用。
可以通过紧缩技术来解决外部碎片
外部碎片指的是还没有被分配出去(不属于任何进程),但由于太小了无法分配给申请内存空间的新进程的内存空闲区域。
3.1.5动态分区分配算法
- 首次适应算法(First Fit)
- 最佳适应算法(Best Fit)
- 最坏适应算法(Worst Fit)
- 邻近适应算法(Next Fit)
1.首次适应算法
算法思想:每次都从低地址开始查找,找到第一个能满足大小的空闲分区。
如何实现:空闲分区以地址递增的次序排列。每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。然后修改相应的空闲分区链或者空闲分区表。
2.最佳适应算法
算法思想:由于动态分区分配是一种连续分配方式,为各进程分配的空间必须是连续的一整片区域。因此为了保证当“大进程”到来时能有连续的大片空间,可以尽可能多地留下大片的空闲区,即,优先使用更小的空闲区。
如何实现:空闲分区按容量递增次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
缺点:每次都选用最小的分区进行分配,会留下越来越多的、很小的、难以利用的内存块。因此这种方法会产生很多的外部碎片。
3.最坏适应算法
算法思想:为了解决最佳适应算法的问题--即留下太多难以利用的小碎片,可以在每次分配时优先使用最大的连续空闲区,这样分配后剩余的空闲区就不会太小,更方便使用。
如何实现:空闲分区按容量递减次序链接,每次分配内存时顺序查找空闲分区链或(空闲分区表)找到能满足要求的第一个空闲分区
缺点:每次都选用最大的分区进行分配,虽然可以让分配后留下的空闲更大,更可用,但是这种方式会导致较大的连续空闲区被迅速用完.如果之后有"大进程"到达,就没有内存分区可用了.
4.邻近适应算法
算法思想:首次适应算法每次都从链头开始查找.这可能会导致低地址部分出现很多很小的空闲分区,而每次分配查找时,都要经过这些分区,因此也增加了这些查找的开销.如果每次都从上次查找结束的位置开始检索,就能解决上述问题。
如何实现:空闲分区以地址递增的顺序排列(可排成一个循环链表)。每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表),找到大小能满足的第一个空闲分区。
3.1.6基本分页存储管理的基本概念
1.连续分配方式的缺点:
- 固定分区分配:缺乏灵活性,会产生大量的内部碎片,内存的利用率很低。
- 动态分区分配:会产生很多外部碎片,虽然可以用“紧凑”技术来处理,但是“紧凑”技术的时间代价很高
如果允许将一个进程分散地装入到许多不相邻的分区中,便可充分地利用内存,而无需再进行“紧凑”
基于这一思想,产生了"非连续分配方式",或者称为“离散分配方式”。
连续分配:为用户进程分配的必须是一个连续的内存空间。
非连续分配:为用户进程分配的可以是一些离散的内存空间。
2.分页存储管理的基本概念
对内存空间的处理:将内存空间分为一个个大小相等的分区(比如:每个分区分为4KB),每个分区就是一个“页框”,或称“页帧”、“内存块”、“物理块”。每个页框有一个编号,即“页框号”(或者说是“页帧号”、“内存块号“、”物理块号“),页框号从0开始。
对进程的处理:将用户进程的地址空间也分为与页框大小相等的一个个区域,称为”页“或者”页面“。每个页面也有一个编号,即”页号“,页号也是从0开始。(进程的最后一个页面可能没有一个页框那么大。因此页框不能太大,否则可能产生过大的内部碎片)
操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框中。也就是说,进程的页面与内存的页框有一一对应的关系。
各个页面不必连续存放,也不必按先后顺序来,可以放到不相邻的各个页框中。
3.如何实现地址的转换
进程在内存中连续存放时,会有一个重定位寄存器,存放装入模块的起始地址,所以模块的实际地址就是模块在内存中的“起始地址”+目标内存单元相对于起始位置的“偏移量”
采用分页技术后,该如何实现地址转换?
- 要算出逻辑地址对应的页号(在进程的哪一页)
- 要知道该页号对应的页面在内存中的起始地址
- 要算出逻辑地址在页面内的“偏移量”
- 物理地址=页面地址+页内偏移量
如何计算?
需要访问逻辑地址是80的内存单元,如何转化为物理地址?这里的页面长度是50
页号=逻辑地址/页面长度(取除法的整数部分)
页号=80/50=1
页内偏移量=逻辑地址%页面长度(取余数)
页内偏移量=80%50=30
页面在内存中起始地址:操作系统需要某种数据结构记录各个页面的起始位置
假设这里操作系统记录了1号页在内存中存放的起始地址为450
所以物理地址=450+30=480
为了方便计算页号、页内偏移量,页面大小一般设为2的整数幂
假设用32个二进制位表示逻辑地址,页面大小为2^10次B=1024B=1KB
0号页的逻辑地址空间应该是0~1023,用二进制表示应该是:
00000000000000000000000000000000~00000000000000000000001111111111
1号页的逻辑地址空间应该是1024~2047,用二进制表示应该是:
00000000000000000000010000000000~00000000000000000000011111111111
结论:如果每个页面大小为2kB,用二进制表示逻辑地址,则末尾k位就是页内偏移量,其余部分就是页号
4.逻辑地址结构
地址长度为32位,其中011位为“**页内偏移量**”,或者说是**页内地址**,1231位为页号
31……12 | 11……0 |
---|---|
页号P | 页内偏移量W |
如果有K位表示页内偏移量,则说明在系统中一个页面的大小是2k个内存单元
如果有M位表示页号,则说明在该系统中,一个进程最多允许有2m个页面
所以如何实现地址转换?
- 要算出逻辑地址对应的页号
- 要知道该页号对应的页面在内存中的起始地址
- 要算出逻辑地址在页面内的“偏移量”
- 物理地址=页面起始地址+页内偏移量
十进制:
页号=逻辑地址/页面长度(取除法的整数部分)
页内偏移量=逻辑地址%页面长度(取余数)
5.页表
为了能知道进程的每个页面在内存中存放的位置,操作系统要为每个进程建立一张页表。
为什么每个页表项长度相同,页号是“隐含的”?
example:
某系统物理内存大小为4GB,页面大小为4KB,则每个页表项至少应该为多少字节?
4GB=232 B , 4KB=212 B
因此4GB的内存总共会被分为232 B / 212 B = 220 个内存块,因此内存块的范围应该是0 ~ 220 -1,因此至少需要20个二进制位才能表示这么多的内存块号,因此至少需要3个字节才够(每个字节8个二进制位,3个字节共24个二进制位)
各页表项会按顺序连续地存放在内存中,只需要知道页表存放的起始地址和页表项长度,即可找到各个页号对应的页表项存放的位置
例如:页表在内存中存放的起始地址是X,页表项长度为上述所说的3,则M号页对应的页表项存放的内存地址就为X+3*M
3.1.7基本地址变换机构
1.基本地址变换
基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。
系统中会设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的起始地址和页表长度存放在进程控制块(PCB)中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。
注意:页面大小是二的整数幂
假设页面大小为L,逻辑地址A到物理地址E的变换过程如下:
(1)计算页号P和页内偏移量W(如果用十进制数手算,则P=A/L , W=P%L; 但在实际计算机运行时,逻辑地址结构是固定不变的,因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)
(2)比较页号P和页表长度M,若P≥M,则产生越界中断,否则继续执行。(注意,页号是从0开始的,而页表长度至少是1,因此P=M时也会越界)
(3)页表中页号P对应的页表项地址=页表起始地址F+页号P*页表项长度,取出该页表项内容b,即为内存块号。(注意区分页表项长度,页表长度,页面大小的区别。)
页表长度:指的是这个页表中总共有几个页表项,即总共有几个页
页表项长度:指的是每个页表项占多大的存储空间;
页面大小:指的是一个页面占多大的存储空间
(4)计算E=b*L+W,b是内存块号,就可以用得到的物理地址去访问了。(如果内存块号、页面偏移量是用二进制表示的,那么把二者拼接起来就是最终的物理地址了)
例:若页面大小为1KB,页号2对应的内存块号 b=8,将逻辑地址A=2500,转换为物理地址E。
等价描述:某系统按字节寻址(因为是以B即字节为单位的),逻辑地址结构中,页内偏移量占10位(页内偏移量就等于页面大小),210 B=1KB,页号2对应的内存块号为 b=8,将逻辑地址转换为物理地址。
(1)计算逻辑地址对应的页号和页内偏移量
页号P=A/L=2500/1024=2 页内偏移量W=A%L=2500%1024=452
(2)比较页号和页表长度,是否产生越界中断
根据题意,页号2没有越界,对应的内存块号为b=8
(3)计算物理地址
物理地址E=8*1024+452=8644
在分页存储管理(页式管理)的系统中,只要确定了每个页面的大小,逻辑地址结构就确定了。因此,页式管理中地址是一维的。即,只要给出一个逻辑地址,系统就可以自动地算出页号、页内偏移量两个部分,并不需要显示地告诉系统这个逻辑地址中,页内偏移量占多少位。
2.页表项大小的深入理解
之前的理解是:
某系统物理内存大小为4GB,页面大小为4KB,则每个页表项至少应该为多少字节?
4GB=232 B , 4KB=212 B
因此4GB的内存总共会被分为232 B / 212 B = 220 个内存块,因此内存块的范围应该是0 ~ 220 -1,因此至少需要20个二进制位才能表示这么多的内存块号,因此至少需要3个字节才够(每个字节8个二进制位,3个字节共24个二进制位)
各页表项会按顺序连续地存放在内存中,只需要知道页表存放的起始地址和页表项长度,即可找到各个页号对应的页表项存放的位置
例如:页表在内存中存放的起始地址是X,页表项长度为上述所说的3,则M号页对应的页表项存放的内存地址就为X+3*M
一个页面为4KB,则每个页框可以存放4096/3=1365个页表项,但是这个页框会剩余4096%3=1B的页内碎片。
如果每个页表项占4个字节,则每个页框刚好可存放1024个页表项,1024号页表项虽然是存放在下一个页框中(页表项是从0号页表开始的),但是它的地址依然可以用X+4*1024得出。
结论:理论上,页表项长度为3B即可表示内存块号的范围,但是,为了方便页表的查询,常常会让一个页表项占更多的字节,使得每个页面恰好可以装得下整数个页表项。
3.1.8具有快表的地址变换机构
1.局部性原理
int i=0;
int a[100];
while(i<100){
a[i]=i;
i++;
}
在10号内存块中中存放程序对应的指令
在23号内存块中存放程序中定义的变量
那么这个程序在执行时,会很频繁地访问10和23号内存块
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据可能再次被访问。(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个存储单元,不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的,并且程序的指令也是顺序地在内存中存放的)
在基本地址变换机构中,每次访问一个逻辑地址,都需要查询内存中的页表。由于局部性原理,可能连续很多次查到的都是同一个页表项,基于这个特性引入了快表机制。
2.快表
快表,又称联想寄存器(TLB),是一种访问速度比内存快很多的高速缓冲存储器,用来存放当前访问的若干页表项,以加速地址变换的过程。与此对应,内存中的页表通常被称为慢表
3.引入快表后,地址的变换过程
(1)CPU给出逻辑地址,由某个硬件算得页号、页内偏移量,将页号与快表中的所有页号进行比较。
(2)如果找到匹配的页号,说明要访问的页表项在快表中有副本,则直接从中取出该页对应的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表命中,则访问某个逻辑地址仅需一次访存即可。
(3)如果没有找到匹配的页号,则需要访问内存中的页表,找到对应页表项,得到页面存放的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表未命中,则访问某个逻辑地址需要两次访问内存(注意:找到页表项后,应同时将其存入快表,以便后面可能再次访问。但若快表已满,则必须按照一定的算法对旧的页表项进行替换)
例题:某系统使用基本分页存储管理,并采用了具有快表的地址变换机构。访问一次快表耗时1us,访问一次内存耗时100us。若快表的命中率为90%,那么访问一个逻辑地址的平均耗时是多少?
(1+100)*0.9+(1+100+100)*0.1=111us
有的系统支持快表和慢表同时查找,如果是这样,平均耗时应该是:
(1+100)*0.9+(100+100)*0.1=110.9us
若未采用快表机制,则访问一个逻辑地址需要100+100=200us
显然,引入快表机制后,访问一个逻辑地址的速度快多了。
3.1.9两级页表
1.单级页表存在的问题
某计算机系统按字节寻址,支持32位的逻辑地址,采用分页存储管理,页面大小为4KB,页表项长度为4B。
4KB=212 B,因此页内地址要用12位表示,剩余20位表示页号。因此,该系统中,用户进程最多有220页。相应的,一个进程的页表中,最多会有220=1M=1048576个页表项,所以一个页表最大需要220*4B=222 B,共需要222/212=210个页框存储该页表。
根据局部性原理可知,很多时候,进程在一段时间内只需要访问某几个页面就可以正常运行了。因此没有必要让整个页表都常驻内存。
2.如何解决单级页表的问题?
问题一:页表必须连续存放,因此当页表很大时,需要占用很多个连续的页框。
问题二:没有必要让整个页表在内存常驻,因为进程在一段时间内可能只需要访问某几个特定的页面。
如何解决页表连续存放的问题?
可以像解决进程连续存放的问题一样去解决。
将页表进行分组,使每个内存块刚好可以放入一个分组(比如一个页面大小4KB,每个页表项4B,每个页面就可以存放1K个页表项,因此每1K个连续的页表项为1组,再将各组离散地放到各个内存块中)
另外,要为离散分配的页表再建立一张页表,称为页目录表,或称外层页表,或顶层页表
问题二:没有必要让整个页表在内存常驻,因为进程在一段时间内可能只需要访问某几个特定的页面。
可以在需要访问页面时才把页面调入内存(虚拟存储技术)。可以在页表项中增加一个标志位,用于表示该页面是否已经调入内存。若想访问的页面不在内存中,则产生缺页中断(内中断),然后将目标页面从外存调入内存。
3.两级页表的原理、地址结构
4.如何实现地址变换
例:将逻辑地址(0000000000,0000000001,1111111111)转化为物理地址(十进制表示)。
(1)按照地址结构将逻辑地址拆分为3部分
(2)从PCB中读出页目录表起始地址,再根据一级页号查页目录表,找到下一级页表在内存中的存放位置
(3)根据二级页号查表,找到最终想访问的内存块号
(4)结合页内偏移量得到物理地址
一级页号是0,在页目录表中找到0号页表存放的内存块号是3,从该内存块中读出二级页表,二级页号是1,再根据二级页号查出内存块号为4,最终访问的内存块是4号内存块,每个内存块大小是4096,所以该内存块的起始地址是4*4096=16384,页内偏移量是1023,所以最终的物理地址为16384+1023=17407
5.注意的细节
(1)若采用多级页表机制,则各级页表的大小不能超过一个页面
例题:某系统按字节编址,采用40位逻辑地址,页面大小为4KB,页表项大小为4B,假设采用纯页式存储,则要采用()级页表,页内偏移量为()位?
页面大小=4KB=212 B,按字节编址,因此页内偏移量为12位
页号=40-12=28位
页面大小=212 B,页表项大小=4B,则每个页面可以存放212 / 4=210个页表项,因此各级页表最多包含210个页表项,则需要10个二进制位才能映射到210个页表项,因此每一级的页表对应号应为10位。总共28位的页号至少要分为3级
(2)两级页表的访问内存次数分析(假设没有快表机构)
第一次访问内存:访问内存中的页目录表
第二次访问内存:访问内存中的二级页表
第三次访问内存:访问目标内存单元
3.1.10基本分段存储管理方式
知识总览
1.分段
进程的地址空间:按照程序自身的逻辑关系划分为若干个段,每个段都有一个段名(在低级语言中,程序使用段名来编程),每段从0开始编址
内存分配规则:以段为单位进行分配,每个段在内存中占据连续空间,但各段之间可以不相邻
编译程序会把段名转换为段号
分段系统的逻辑地址结构由段号(段名)和段内地址(段内偏移量)所组成。如:
31......16 | 15......0 |
---|---|
段号 | 段内地址 |
段号的位数决定了每个进程最多可以分为多少段
段内地址位数决定了每个段的最大长度是多少
上述例子中,若系统是按字节寻址,则段号占16位,因此在该系统中,每个进程最多有216 =64K 个段
段内地址占16位,因此每个段的最大长度是216 =64KB
LOAD 1,[D] | <A>;//将分段D中A单元内的值读入寄存器1
STORE 1,[X] | <B>;//将寄存器1的内容存入X分段的B单元中
写程序时使用的段名[D],[X]会被编译程序翻译为对应段号
<A>单元,<B>单元会被编译程序翻译成段内地址
2.段表
程序分为多个段,各段离散地装入内存,为了保证程序能正常运行,就必须能从物理内存中找到各个逻辑段的存放位置。为此,需要为每个进程建立一张段映射表,简称“段表”
(1)每个段对应一个段表项,其中记录了该段在内存中的起始位置(又称“基址”)和段的长度。
(2)每个段表项的长度是相同的。例如:某系统按字节寻址,采用分段存储管理,逻辑地址结构为段号16位,段内地址16位,因此用16位即可表示最大段长。物理内存大小为4GB(可用32位表示整个物理内存的地址空间)。因此可以让每个段表项占16+32=48位,即6B。由于段表项长度相同,因此段号可以是隐含的,不占存储空间。若段表存放的起始地址为M,则K号段对应的段表项存放的地址为M+K*6
3.地址变换
LOAD 1,[D] | <A>;//将分段D中A单元内的值读入寄存器1
经过编译程序编译后,形成等价的机器指令:
“取出段号为2,段内地址为1024”的内存单元中的内容,放到寄存器1中。
CPU执行指令时需要将逻辑地址变换为物理地址
4.分段、分页管理的对比
页是信息的物理单位。分页的主要目的是为了实现离散分配,提高内存利用率。分页仅仅是系统管理上的需要,完全是系统行为,对用户是不可见的
段是信息的逻辑单位。分段的主要目的是更好地满足用户需求。一个段通常包含着一组属于一个逻辑模块的信息。分段对用户是可见的,用户编程时需要显式地给出段名。
页的大小固定,且由系统决定。段的长度却不固定,决定于用户编写的程序。
分页的用户进程地址空间是一维的,程序员只需给出一个记忆符即可表示一个地址。
分段的用户进程地址空间是二维的,程序员在标识一个地址时,既要给出段名,也要给出段内地址。
分段比分页更容易实现信息的共享和保护
不能修改的代码称为纯代码或可重入代码(不属于临界资源),这样的代码是可以共享的。可修改的代码是不能共享的(比如,有一个代码段中有很多变量,各进程并发地同时访问可能造成数据的不一致)
访问一个逻辑地址需要几次访存?
分页(单级页表):第一次访问内存——查询内存中的页表,第二次访问内存——访问目标内存单元。总共两次访存
分段:第一次访问内存——查询内存中的段表,第二次访问内存——访问目标内存单元。总共两次访存
与分页系统类似,分段系统中也可以引入快表机制,将近期访问过的段表项放到快表中,这样可以少一次访问,加快地址变换速度
知识回顾与重要考点
3.1.11段页式管理方式
知识总览
1.分页、分段的优缺点分析
优点 | 缺点 | |
---|---|---|
分页管理 | 内存空间利用率高,不会产生外部碎片,只会有少量的页内碎片 | 不方便按照逻辑模块实现信息的共享和保护 |
分段管理 | 很方便按照逻辑模块实现信息的共享和保护 | 如果段长过大,为其分配很大的连续空间会很不方便。另外,段式管理会产生外部碎片 |
产生的外部碎片可以用“紧凑”来解决,但是要付出较大的时间代价
2.段页式管理
将进程先按逻辑模块分段,再将各段分页(如每个页面4KB)
再将内存空间分为大小相同的内存块/页框/页帧/物理块
进程将各页面分别装入各内存块中
3.段页式管理的逻辑地址结构
分段系统的逻辑地址结构由段号和段内地址(段内偏移量)组成。
31......16 | 15......0 |
---|---|
段号 | 段内地址 |
段页式系统的逻辑地址结构由段号、页号、页内地址(页内偏移量)组成。
31......16 | 15......12 | 11......0 |
---|---|---|
段号 | 页号 | 页内偏移量 |
段号的位数决定了每个进程最多可以分为几个段,页号位数决定了每个段最大有多少页,页内偏移量决定了页面大小、内存块大小是多少
若某系统是按字节寻址的,则段号占16位,因此在该系统中,每个进程最多有216=64K个段,页号占4位,因此每个段最多有24=16页,页内偏移量12位,因此每个页面、每个内存块大小为212=4096=4KB
“分段”对用户是可见的,程序员编程时需要显式地给出段号、段内地址。而将各段“分页”对用户是不可见的。系统会根据段内地址自动划分页号和页内偏移量。
因此段页式管理的地址结构是二维的
4.段表、页表
每个段对应一个段表项,每个段表项由段号、页表长度、页表存放块号(页表起始地址)组成。每个段表项长度相同,段号是隐含的。
每个页面对应一个页表项,每个页表项由页号、页面存放的内存块号组成。每个页表项长度相等,页号是隐含的。
一个进程只有一个段表,但是可以有多个页表
5.通过逻辑地址访问内存
3.2.1虚拟内存的基本概念
知识总览
1.传统存储管理方式的特征、缺点
一次性:作业必须一次性全部装入内存后才能开始运行。这会造成两个问题:(1)作业很大时,不能全部装入内存,导致大作业无法运行;(2)当大量作业要求运行时,由于内存无法容纳所有作业,因此只有少量作业能运行,导致多道程序并发度下降
驻留性:一旦作业被装入内存,就会一直驻留在内存中,直至作业运行结束。事实上,在一个时间段内,只需要访问作业的一小部分数据即可正常运行,这就导致了内存中会驻留大量的、暂时用不到的数据,浪费了宝贵的内存资源。
2.局部性原理
int i=0;
int a[100];
while(i<100){
a[i]=i;
i++;
}
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据可能再次被访问。(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个存储单元,不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的,并且程序的指令也是顺序地在内存中存放的)
如何应用局部性原理?
高速缓冲技术的思想:将近期会频繁访问到的数据放到更高速的存储器中,暂时用不到的数据放在更低速的存储器中。
快表机构就是将近期常访问的页表项副本放到更高速的联想寄存器中。
3.虚拟内存的定义和特征
基于局部性原理,在程序装入时,可以将程序中很快就会用到的部分装入内存,暂时用不到的部分留在外存,就可以让程序开始执行。
在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序。
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存
在操作系统的管理下,在用户看来似乎有一个比实际内存大得多的内存,这就是虚拟内存(操作系统虚拟性的一个体现,实际的物理内存大小没有变,只是在逻辑上进行了扩充)
易混淆知识点:
虚拟内存的最大容量是由计算机的地址结构(CPU寻址范围)确定的
虚拟内存的实际容量=min(内存和外存容量之和,CPU寻址范围)
如:某计算机地址结构为32位,按字节编址,内存大小为512MB,外存大小为2GB。
则虚拟内存的最大容量为232 B=4GB
虚拟内存的实际容量=min(232 B,512MB+2GB)=512MB+2GB
主要特征:
- 多次性:无需在作业运行时一次性全部装入内存,而是允许被分成多次调入内存
- 对换性:在作业运行时无需一直常驻内存,而是允许在作业运行过程中,将作业换入、换出
- 虚拟性:从逻辑上扩充了内存的容量,使用户看到的内存容量,远大于实际的容量
4.如何实现虚拟内存技术
虚拟内存的实现需要建立在离散分配的内存管理方式基础上。
主要区别:在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序(操作系统要提供请求调页或请求调段功能)
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存(操作系统要提供页面置换或者段置换的功能)
知识回顾与重要考点
3.2.2请求分页管理方式
知识总览
请求分页存储管理与基本分页管理的主要区别:
在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序。(操作系统要提供请求调页功能,将缺失页面从外存调入内存)
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存(操作系统要提供页面置换的功能,将暂时用不到的页面换出外存)
请求分页管理方式:
- 页表机制
- 缺页中断机制
- 地址变换机构
1.页表机制
页号 | 内存块号 | 状态位 | 访问字段 | 修改位 | 外存地址 |
---|---|---|---|---|---|
0 | 无 | 0 | 0 | 0 | x |
1 | b | 1 | 10 | 0 | y |
2 | c | 1 | 6 | 1 | z |
页号是隐含的
状态位:表示是否已调入内存
访问字段:可以记录最近被访问过几次,或者记录上次被访问的时间,供置换算法选择换出页面时参考
修改位:页面调入内存后是否被修改过
外存地址:页面在外存中的存放位置
2.缺页中断机构
在请求分页系统中,每当要访问的页面不在内存时,便产生一个缺页中断,然后由操作系统的缺页中断处理程序处理中断。
此时缺页的进程阻塞,放入阻塞队列,调页完成后再将其唤醒,放回就绪队列。
如果内存中有空闲块,则为进程分配一个空闲块,将所缺页面装入该块,并修改页表中相应的页表项。
如果内存中没有空闲块,则由页面置换算法选择一个页面淘汰,若该页面在内存期间被修改过,则要将其写回外存。未修改的页面不用写回外存。
缺页中断是因为当前执行的指令想要访问的目标页面未调入内存而产生的,因此属于内中断。
一条指令在执行期间,可能产生多次缺页中断(如:copy A to B,即将逻辑地址A中的数据复制到逻辑地址B,而A、B属于不同的页面,则有可能产生两次中断)
中断的分类:
- 内中断(内部异常):信号来源于CPU内部
- 陷阱、陷入(trap):有意而为之的异常,如系统调用
- 故障(fault):由错误条件引起的,可能被故障处理程序修复,如缺页中断
- 终止:不可恢复的致命错误造成的结果
- 外中断:信号来源于CPU外部
- I/O中断请求
- 人工干预
3.地址变换机构
快表中的页面一定是在内存中的。若某个页面被换出外存,则快表中的相应表项也要删除,否则有可能访问错误的页面。
(1)写指令才需要修改“修改位”,并且一般来说只需要修改快表中的数据,只有将快表项删除时,才需要写回内存中的慢表。这样可以减少访问次数
(2)和普通的中断处理一样,缺页中断依然需要保留CPU现场
(3)需要某种“页面置换算法”
(4)换入、换出页面都需要启动慢速的I/O操作,如果换入换出太频繁,会有很大的开销
(5)页面调入内存后,需要修改慢表,同时也需要将表项复制到快表中
知识回顾和重要考点
3.2.3页面置换算法
知识总览
请求分页存储管理与基本分页管理的主要区别:
在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序。(操作系统要提供请求调页功能,将缺失页面从外存调入内存)
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存(操作系统要提供页面置换的功能,将暂时用不到的页面换出外存)
页面置换算法:页面的换入、换出需要磁盘I/O,会有较大的开销,因此好的置换算法应该追求更少的缺页率
- 最佳置换算法(OPT)
- 先进先出置换算法(FIFO)
- 最近最久未使用置换算法(LRU)
- 时钟置换算法(CLOCK)
- 改进型的时钟置换算法
1.最佳置换算法(OPT)
每次选择淘汰的页面将是以后永不使用,或者在最长时间内不再被访问的页面,这样可以保证最低的缺页率。
例:假设系统为某进程分配了3个内存块,并考虑到有以下页面号引用串(会依次访问这些页面):
7,0,1,2,0,3,0,4,2,3,0,3,2,1,2,0,1,7,0,1
访问页面 | 7 | 0 | 1 | 2 | 0 | 3 | 0 | 4 | 2 | 3 | 0 | 3 | 2 | 1 | 2 | 0 | 1 | 7 | 0 | 1 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
内存块1 | 7 | 7 | 7 | 2 | 2 | 2 | 2 | 2 | 7 | |||||||||||
内存块2 | 0 | 0 | 0 | 0 | 4 | 0 | 0 | 0 | ||||||||||||
内存块3 | 1 | 1 | 3 | 3 | 3 | 1 | 1 | |||||||||||||
是否缺页 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
当访问到第四个数也就是2号页面时,此时根据该算法的思想,在后面的访问过程中,最长时间不再被访问的是7,所以置换的页面也就是7,当访问到第6个数,也就是3号页面的时候,后面的过程中最长时间不再被访问的是1,所以置换的页面也就是1。后面的置换过程以此类推。
整个过程缺页中断发生了9次,页面置换发生了6次。所以:缺页时未必发生页面置换。若还有可用的空闲内存块,就不用进行页面置换。
缺页率=9/20=45%
最佳置换算法可以保证最低的缺页率,但实际上,只有在进程执行的过程中才能知道接下来会访问到的是哪个页面。操作系统无法提前预判页面访问序列。因此,最佳置换算法是无法实现的。
2.先进先出置换算法(FIFO)
每次选择淘汰的页面是最早进入内存的页面
实现方法:把调入内存的页面根据调入的先后顺序排成一个队列,需要换出页面时选择队头页面即可。队列的最大长度取决于系统为进程分配了多少个内存块。
例:假设系统为某进程分配了3个内存块,并考虑到有以下页面号引用串:
3,2,1,0,3,2,4,3,2,1,0,4
访问页面 | 3 | 2 | 1 | 0 | 3 | 2 | 4 | 3 | 2 | 1 | 0 | 4 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
内存块1 | 3 | 3 | 3 | 0 | 0 | 0 | 4 | 4 | 4 | |||
内存块2 | 2 | 2 | 2 | 3 | 3 | 3 | 1 | 1 | ||||
内存块3 | 1 | 1 | 1 | 2 | 2 | 2 | 0 | |||||
是否缺页 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
分配3个内存块时,缺页次数:9次
若分配4个内存块
访问页面 | 3 | 2 | 1 | 0 | 3 | 2 | 4 | 3 | 2 | 1 | 0 | 4 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
内存块1 | 3 | 3 | 3 | 3 | 4 | 4 | 4 | 4 | 0 | 0 | ||
内存块2 | 2 | 2 | 2 | 2 | 3 | 3 | 3 | 3 | 4 | |||
内存块3 | 1 | 1 | 1 | 1 | 2 | 2 | 2 | 2 | ||||
内存块4 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | |||||
是否缺页 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
分配4个内存块时,缺页次数:10次
Belady异常——当为进程分配的内存块数增大时,缺页次数不减反增的异常现象。
只有FIFO算法会产生Belady异常。另外,FIFO算法虽然实现简单,但是该算法与实际进程运行时的规律不适应,因为先进入的页面也有可能最经常被访问。因此,算法性能差。
3.最近最久未使用算法(LRU)
每次淘汰的页面是最近最久未使用的页面
实现方法:赋予每个页面对应的页表项中,用访问字段记录该页面自上次被访问以来所经历的时间t。当需要淘汰一个页面时,选择现有页面中t值最大的,即最近最久未使用的页面
例:假设系统为某进程分配了4个内存块,并考虑有以下页面号引用串:
1,8,1,7,8,2,7,2,1,8,3,8,2,1,3,1,7,1,3,7
访问页面 | 1 | 8 | 1 | 7 | 8 | 2 | 7 | 2 | 1 | 8 | 3 | 8 | 2 | 1 | 3 | 1 | 7 | 1 | 3 | 7 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
内存块1 | 1 | 1 | 1 | 1 | 1 | 1 | ||||||||||||||
内存块2 | 8 | 8 | 8 | 8 | 7 | |||||||||||||||
内存块3 | 7 | 7 | 3 | 3 | ||||||||||||||||
内存块4 | 2 | 2 | 2 | |||||||||||||||||
是否缺页 | 是 | 是 | 是 | 是 | 是 | 是 |
当第一次要访问页号为3的页面时,此时内存已满,根据算法原理,要把最近最久未使用的页面置换出去,从该列往前数最远的就是7,所以3置换的页面就是7,后面的置换以此类推。
该算法的实现需要专门的硬件支持,虽然算法性能好,但是实现困难,开销大
4.时钟置换算法
最佳置换算法性能好,但无法实现;先进先出置换算法实现简单,但算法性能差;最近最久未使用置换算法性能好,是最接近OPT算法性能的,但是实现起来需要专门的硬件支持,算法开销大。
时钟置换算法是一种性能和开销较均衡的算法,又称CLOCK算法,或最近未使用算法(NRU,Not Recently Used)
简单的CLOCK算法实现:为每个页面设置一个访问位,再将内存中的页面都通过链接指针链接成一个循环队列。当某页被访问时,其访问位变成1。当需要淘汰一个页面时,只需要检查页的访问位。如果是0就将该页换出;如果是1,则将它变为0,暂不换出,继续检查下一个页面,若第一轮扫描中所有页面都是1,则将这些页面的访问位依次变为0后,再进行下一轮扫描(第二轮扫描中一定会有访问位为0的页面,因此简单的CLOCK算法选择一个淘汰页面最多会经过两轮扫描)
访问位为1,表示最近访问过;
访问位为0,表示最近没访问过。
例:假设系统为某进程分配了5个内存块,并考虑到有以下页面号引用串:
1,3,4,2,5,6,4,7
第一步,访问前五个页面时都是直接将页面放入内存块即可,此时访问都为1,箭头刚好指向队首
第二步,当访问页号为6的页面时,此时内存已满,需要置换页面
第一轮循环发现访问都为1,先都把访问位变为0,此时指针也指向1号页,要访问6号页,此时就把1号页置换出去,置换为6号页,并且指针跳转到下一个内存块
接下来访问3号页,4号页,所以需要把3号页,4号页的访问位都变为1,但是此时指针并不跳转,指针只有在需要置换页面的时候才开始进行跳转扫描
然后当访问7号页的时候,指针再开始跳转,先将3号页的访问位变为0,再将4号页的访问位变为0,然后跳转到2号页的时候发现访问位是0,此时将2号页置换为7号页(此时7号页的访问位也为1),然后指针跳转到下一个内存块
5.改进型的时钟置换算法
简单的时钟置换算法仅考虑到一个页面最近是否被访问过。事实上,如果被淘汰的页面没有被修改过,就不需要执行I/O操作写回内存。只有被淘汰的页面被修改过时,才需要写回内存。
因此,除了考虑一个页面最近有没有被访问过之外,操作系统还应考虑页面有没有被修改过。在其他条件都相同时,应优先淘汰没有修改过的页面,从而避免I/O操作。
修改位=0,表示没有被修改过,修改位=1,表示页面被修改过。用(访问位,修改位)的形式表示各页面状态。(1,1)即表示一个页面近期被访问过,且被修改过。
算法规则:将所有可能被置换的页面排成一个循环队列
第一轮:从当前位置开始扫描到第一个(0,0)的页面用于替换。本轮不修改任何标志位
第二轮:若第一轮扫描失败,则重新扫描,查找第一个(0,1)的页面用于替换,本轮将所有扫描过的页面的访问位设为0
第三轮:若第二轮扫描失败,则重新扫描,查找第一个(0,0)的页面用于替换。本轮不修改任何标志位
第四轮:若第三轮扫描失败,则重新扫描,查找第一个(0,1)的页面用于替换。
由于第二轮已将所有页面的访问位都设为0,因此经过第三轮、第四轮扫描一定会有一个页面被选中,因此改进型CLOCK置换算法选择一个淘汰页面最多会进行四轮扫描
具体细节看B站王道考研操作系统3.2.3页面置换算法的18.57秒
知识回顾与重要考点
3.2.4页面分配策略
知识总览
1.页面分配、置换策略
驻留集:指请求分页存储管理中给进程分配的物理块的集合。
在采用了虚拟存储技术的系统中,驻留集大小一般小于进程的总大小
(一种极端情况:若某进程共有100个页面,则该进程的驻留集大小为100时,进程可以全部放入内存,运行期间不可能再发生缺页。若驻留集大小为1,则进程运行期间必定会极频繁地缺页)
若驻留集太小,会导致缺页频繁,系统要花费大量的时间来处理缺页,实际用于进程推进的时间很少;驻留级太大,又会导致多道程序并发度下降,资源利用率低。所以应该选择一个合适的驻留集大小
固定分配:操作系统为每个进程分配一组固定数目的物理块,在进程运行期间不再改变。即,驻留集大小不变。
可变分配:先为每个进程分配一定数目的物理块,在进程运行期间,可根据情况做适当的增加或减少。即,驻留集大小可变
局部置换:发生缺页时只能选进程自己的物理块进行置换
全局置换:可以将操作系统保留的空闲物理块分配给缺页进程,也可以将别的进程持有的物理块置换到外存,再分配给缺页进程
局部置换 | 全局置换 | |
---|---|---|
固定分配 | √ | - |
可变分配 | √ | √ |
全局置换意味着一个进程拥有的物理块数量必然会改变,因此不可能是固定分配
固定分配局部置换:操作系统为每个进程分配一组固定数目的物理块,在进程运行期间不再改变。若进程在运行中发生缺页,则只能从该进程在内存中的页面选出一页换出,然后再调入需要的页面.这种策略的缺点是:很难在刚开始就确定应为每个进程分配多少物理块才算合理.(采用这种策略的系统可以根据进程大小、优先级、或是根据程序员给出来的参数来确定为一个进程分配的内存块数)
可变分配全局置换:先为每个进程分配一定数目的物理块。操作系统会保持一个空闲物理队列。当某进程发生缺页时,从空闲物理块中取出一块分配给该进程;若已无空闲物理块,则可选择一个未锁定的页面换出外存,再将该物理块分配给缺页的进程。采用这种策略时,只要某进程发生缺页,都可获得新的物理块,仅当空闲物理块用完时,系统才选择一个未锁定的页面调出。被选择调出的页面可能是系统中任意一个进程的页面,因此这个被选中的进程拥有的物理块会减少,缺页率会增加。
可变分配局部置换:先为每个进程分配一定数目的物理块。当某进程发生缺页时,只允许从该进程自己的物理块中选出一个进行换出外存。如果进程在运行中频繁地缺页,系统会为该进程多分配几个物理块,直至该进程缺页率趋势趋于正常;反之,如果进程在运行中缺页率特别低,则可适当减少分配给该进程的物理块。
可变分配全局置换:只要缺页就分配新物理块
可变分配局部置换:要根据发生缺页的频率来动态地增加或减少进程的物理块
2.何时调入页面
1.预调页原理:根据局部性原理,一次调入若干个相邻的页面可能比一次调入一个页面更高效。但如果提前调入的页面中大多数都没被访问过,则又是低效的。因此可以预测不久之后可能访问到的页面,将它们预先调入内存,但目前预测成功率只有50%左右,故这种策略主要用于进程的首次调入,由程序员指出应该先调入哪些部分。(运行前调入)
2.请求调页策略:进程在运行期间发现缺页时才将所缺页面调入内存。由这种策略调入的页面一定会被访问到,但由于每次只能调入一页,而每次调页都要磁盘I/O操作,因此I/O开销较大。(运行时调入)
3.从何处调入页面
1.系统拥有足够的对换区空间:页面的调入、调出都是在内存与对换区之间进行,这样可以保证页面的调入、调出速度很快。在进程运行前,需将进程相关的数据从文件区复制到对换区。
2.系统缺少足够的对换区空间:凡是不会被修改的数据都直接从文件区调入,由于这些页面不会被修改,因此换出时不必写回磁盘,下次需要时再从文件区调入即可。对于可能被修改的部分,换出时需写回磁盘对换区,下次需要时再从对换区调入。
3.UNIX方式:运行之前进程有关的数据全部放在文件区,故未使用过的页面,都可从文件区调入。若被使用过的页面需要换出,则写回对换区,下次需要时从对换区调入。
4.抖动现象(颠簸)
刚刚换出的页面马上又要换入内存,刚刚换入的页面马上又要换出外存,这种频繁的页面调度行为称为抖动,或颠簸。产生抖动的主要原因是进程频繁访问的页面数目高于可用的物理块数(分配给进程的物理块不够)
为进程分配的物理块太少,会使进程发生抖动现象。为进程分配的物理块太多,又会降低系统整体的并发度,降低某些资源的利用率
为了研究为应该为每个进程分配多少个物理块, Denning 提出了进程“工作集”的概念
5.工作集
驻留集:指请求分页存储管理中给进程分配的内存块的集合。
工作集:指在某段时间间隔里,进程实际访问页面的集合。
操作系统会根据“窗口尺寸”来算出工作集。
例:某进程的页面访问序列如下,窗口尺寸为4,各时刻的工作集为?
24,15,18,23,24,17,18,24,18,17,17,15
工作集大小可能小于窗口尺寸,实际应用中,操作系统可以统计进程的工作集大小,根据工作集大小给进程分配若干内存块。如:窗口尺寸为5,经过一段时间的监测发现某进程的工作集最大3,那么说明该进程有很好的局部性,可以给这个进程分配3个以上的内存块即可满足进程的运行需要。
一般来说,驻留集大小不能小于工作集大小,否则进程运行过程中将频繁缺页。
拓展:基于局部性原理可知,进程在一段时间内访问的页面与不久之后会访问的页面是有相关性的。因此,可以根据进程近期访问的页面集合(工作集)来设计一种页面置换算法——选择一个不在工作集中的页面进行淘汰。