首页 > 编程语言 >各种CLOCK算法

各种CLOCK算法

时间:2024-09-28 14:14:43浏览次数:7  
标签:各种 CLOCK hot HAND 访问 算法 recency 内存 cold

这篇文章的背景是操作系统里的页缓冲。

LRU要求每次访问某个页的时候都进入trap,由操作系统把这个页放到栈顶。显然这是不能接受的。

所以一般采用CLOCK算法或者其变种,其特点是在hit的时候,只需要由硬件执行一个很简单的操作(通常是设置访问位),把这次访问记录下来即可。然后在合适的时机,由操作系统去看这些访问记录,把冷的页替换掉。

朴素CLOCK算法

一圈页,一个指针指向某页,要替换某页时,看指向的那页的访问位是不是1,如果不是就将这页替换掉,如果是则置0,然后移到下一页继续看。

GCLOCK

论文:
Sequentiality and Prefetching in Database Systems
Analysis of the generalized clock buffer replacement scheme for database transaction processing

给每页一个counter,当hit的时候增加它的值,当指针扫过的时候减这个值,减到0就可以替换掉了。好处是可以保留更多的历史访问信息,更精准地把很少访问的页找出来。

Two-Handed Clock

朴素的Clock算法的问题在于,如果访问很多,而过了很久才需要替换某页时,会发现所有的页的访问位都是1,这样就退化到FIFO了。这是保存了太多历史信息导致的。所以思路就是周期性清除历史信息。Two-Handed Clock就是这种算法,它有两个指针,一个fronthand,一个backhand,这两个指针之间的距离(好像)恒定。fronthand负责清除其指向的页的访问位,然后backhand看这个访问位是不是又被置1了,如果是,那说明这个页访问挺频繁的,就跳过它,否则就将这个页free掉。当空闲空间少时,就把指针扫描的速度调快,这样能识别出更多访问不频繁的数据,当空闲空间多时,就把指针扫描速度调慢,只把超级冷的块free掉。当空闲空间超过超过阈值lotsfree后,就停下来不扫描了。

相关文献:

The design and implementation of the 4.3BSD UNIX operating system
好像是本书

4.3 BSD Virtual Memory Management
(Figure 10第17行,goto loop之后,backhand没有移动,这是不是会导致两个指针的距离改变?)

CAR

论文:CAR: Clock with Adaptive Replacement

看起来很复杂的样子

CLOCK-Pro

论文:https://www.usenix.org/legacy/events/usenix05/tech/general/full_papers/jiang/jiang.pdf

在这里插入图片描述

将页分为Hot页,Cold页,所有Hot页都留在内存里,Cold页中,留在内存里的页在图中带有阴影,被换出内存的页在图中没有阴影。图中,打勾表示这个页的访问位为1。令m表示内存中能装下的总页数。为了避免列表过大,我们限制列表中最多有m个不在内存里的cold页。

跟LRU一样,CLOCK-Pro使用recency的概念,距离上次使用的时间越长,recency越高,但是由于我们不能像LRU那样在每次访问页面的时候都去维护这个recency,所以这个recency实际上是通过指针转动来估计的。CLOCK-Pro的基本思想是给每个刚进来的cold页一个测试周期,如果这个页在测试周期中被访问了,那就把这个页变成hot页,否则就把这个页移出列表。我们允许把仍然在测试周期中的cold页换出内存,但是它仍然停留在列表中,直到测试周期结束。

我们设置三个指针:HAND_hot、HAND_cold、HAND_test。HAND_hot指向recency最高的hot页,HAND_cold指向recency最高的在内存里的cold页,HAND_test指向recency最高的处于测试周期的cold页。HAND_hot背面的那个页是recency最小的页,从该页开始逆时针看,这些页的recency逐渐增大,到HAND_hot指向的那个页,recency最大。将HAND_hot背面的那个页称为list head,将HAND_hot指向的那个页称为list tail。

HAND_cold是用来将某个cold页换出的。如果HAND_cold指向的页的访问位是0,就把它换出,然后如果它不在测试周期,就把它移出列表,如果在测试周期,就把它留在列表里。如果HAND_cold指向的页的访问位是1,就把这个页移动到HAND_hot指针的背后,即插入到list head,即将这个页的recency标记为最小(要不要把访问位清0呢?)。此外,如果这个页的访问位为1且在测试周期中,那么就把它变成hot页,并且让HAND_hot指针移动,来让某个hot页变成cold页。
(HAND_cold指向的页是hot页的时候怎么办?跳过吗?)

HAND_hot采取动作时,如果其指向hot页,并且其访问位为0,那就把它变成cold页,但是如果其访问位为1,就把访问位清0,然后跳过它。如果其指向cold页,就终止其测试周期,并且如果它不在内存中时将其从列表中移出(也就是说当HAND_test)用。

如果不在内存中的页数超过了m,那么就需要HAND_test采取行动了。(HAND_test好像会跳过hot页)HAND_test会终止指向的cold页的测试周期,然后如果其不在内存里,就把它移出列表。

所以总的流程是,如果有一个page fault,那么这个page肯定是个cold page,因为hot page不会被换出。首先我们移动HAND_cold来把一个页换出。如果这个faulted page不在列表中,那么我们就把它放到list head,也就是插入到HAND_hot背后,并且标记其处于测试周期。如果这个faulted page在列表中,那么我们直接把它变成hot页,并且移动到list head,然后移动HAND_hot来将一个hot页变成cold页。此外,由于我们之前把一个cold页换出了,这可能会增加不在内存中的cold页的数目,如果这个数目大于m,那就通过移动HAND_test减少之(这一步是在移动HAND_cold之后就做,还是到最后做?)。

猜一下作者的心路历程

不管是LRU,还是朴素的CLOCK,页被换出之后都不再跟踪了,这样就导致recency比较低的块不敢换出去。但是实际上,recency低不代表马上就会reuse。所以就要把换出的页也保留在这个环形列表里,然后recency低的页也可以大胆换出,然后如果发现其实很快就reuse了,就反悔,把它变成hot页,不再轻易换出。但是在列表中的cold页又不一定是recency很低的页,如果一个很老的不在内存里的cold页又被访问了,那也不能随便将其设置为hot页,所以就引入测试周期的概念,其实就是用来查看在给定的一段时间内,这个页能不能被访问两次,能的话就变成hot页。

我的一些问题

论文里的$m_c$到底是个啥???是在内存里的cold页的最大数目吗?可是前面的叙述里也没看到这个值有什么作用啊。

论文里只有在一个页刚刚进入列表时才开启测试周期,那这样的话,如果一个hot页变成了cold页,那岂不是永远都变不回hot页了?我觉得将页插入到list head的时候(比如hot页变成cold页,或者HAND_cold指针指向的cold页的访问位是1,但是不在测试周期的时候)同时开启测试周期应该会更合理一些。

感觉这个论文少了很多实现细节,看得迷迷糊糊的。

标签:各种,CLOCK,hot,HAND,访问,算法,recency,内存,cold
From: https://www.cnblogs.com/searchstar/p/18437905

相关文章

  • 垃圾回收算法
    垃圾回收算法分为跟踪式垃圾回收(Tracinggarbagecollection)和引用计数(Referencecounting)两大类。跟踪式垃圾回收跟踪式垃圾回收的基本原理是先认定一些对象为root,比如全局变量和栈变量。然后跟踪(trace)哪些对象是从这些root可达的,而剩下的从这些root不可达的对象就是garb......
  • 【风光不确定】基于多时间尺度滚动优化算法的主动配电网研究【IEEE33节点】(Matlab代码
    目录......
  • 8592 KMP算法
    首先,我们需要理解KMP算法的基本思想。KMP算法是一种改进的字符串匹配算法,它的主要思想是利用已经部分匹配的这个有效信息,使得后续的匹配中,尽量减少字符串的回溯,提高匹配效率。KMP算法的关键在于通过一个next数组,保存模式串中前后缀的最长的共有元素的长度。当模式串中的字符......
  • AI大模型算法工程师就业宝典—— 高薪入职攻略与转行秘籍!
    从ChatGPT到新近的GPT-4,GPT模型的发展表明,AI正在向着“类⼈化”⽅向迅速发展。GPT-4具备深度阅读和识图能⼒,能够出⾊地通过专业考试并完成复杂指令,向⼈类引以为傲的“创造⼒”发起挑战。现有的就业结构即将发⽣重⼤变化,社会⽣产⼒的快速提升将催⽣新的⾏业和岗位机会。如......
  • 代码随想录算法训练营第二天| 209.长度最小的子数组、59.螺旋矩阵II 、区间和、开发
    209.长度最小的子数组此题注重理解,同时我将res一开始初始化为sums的长度加一(因为不可能为此长度)INT32_MAX是一个常量,代表32位有符号整数的最大值classSolution{public:intminSubArrayLen(inttarget,vector<int>&nums){inti=0,j=0;//i为起始位置,j为......
  • 【算法】二叉树中的 DFS
     【ps】本篇有6 道 leetcode OJ。 目录一、算法简介二、相关例题1)计算布尔二叉树的值.1-题目解析.2-代码编写2)求根节点到叶节点数字之和.1-题目解析.2-代码编写3)二叉树剪枝.1-题目解析.2-代码编写4)验证二叉搜索树.1-题目解析.2-代码编写5)二叉......
  • 【开题报告】基于Springboot+vue基于推荐算法的高校就业管理系统(程序+源码+论文) 计算
    本系统(程序+源码)带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着高等教育的普及与就业市场的日益竞争,高校毕业生面临的就业压力日益增大。传统的高校就业管理方式往往依赖于线下招聘会、简历投递等低效手段,难以......
  • 基于冲突动态监测算法的健身房预约管理系统
    系统展示用户前台界面管理员后台界面系统背景  随着健身热潮的兴起,健身房管理面临着日益增长的会员需求与资源分配的挑战。传统的人工预约方式不仅效率低下,且容易出现时间冲突和资源浪费的情况。为了解决这一问题,基于冲突动态监测算法的健身房预约管理系统......
  • 开普勒优化算法:一种开普勒行星运动定律的元启发式算法
    目录1.摘要2.算法原理3.结果展示4.参考文献5.代码获取1.摘要这项研究介绍了开普勒优化算法(KOA),这是一种基于物理的新元启发式算法,灵感来源于开普勒行星运动定律。KOA通过模拟行星的位置和速度来寻找优化问题的解决方案,其中每个行星代表一个候选解,这些候选解会根据......
  • 算法题:用队列实现一个链表
    下面是添加了注释的ListNode类和LinkedListQueue类,以帮助理解每个部分的功能和目的://定义链表节点类,用于存储队列中的元素classListNode{intval;//存储节点的值ListNodenext;//指向下一个节点的指针//构造函数,用于创建新的节点ListNod......