首页 > 其他分享 >学习笔记10

学习笔记10

时间:2023-11-15 22:44:57浏览次数:35  
标签:10 Unix 笔记 学习 缓冲区 算法 dev 进程 磁盘

目录

知识点归纳

第12章 块设备I/O和缓冲区管理

块设备和I/O缓冲区

  • 由于与内存访问相比,磁盘I/O速度较慢,所以不希望再每次执行读写文件操作时都执行磁盘I/O。因此,大多数文件系统使用I/O缓冲来减少存储设备的物理I/O数量。合理设计的I/O缓方案可显著提高文件I/O缓冲方案可显著提高文件I/O效率并增加系统吞吐量。
  • I/O缓冲的基本原理非常简单。文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取(dev,blk)标识的磁盘块时,它首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果该缓冲区存在并且包含有效数据,那么它只需从缓冲区中读取数据,而无须再次从磁盘中读取数据块。如果该缓冲区不存在,它会为磁盘块分配一个缓冲区,将数据从磁盘读入缓冲区,然后从缓冲区读取数据。当某个块被读入时,该缓冲区将被保存在缓冲区缓存中。以供任意进程对同一个块的下一次读/写请求使用。同样,当进程写入磁盘块时,它首先会获取一个分配给该块的缓冲区。然后,它将数据写人缓冲区,将缓冲区标记为脏,以延迟写入,并将其释放到缓冲区缓存中。由于脏缓冲区包含有效的数据,因此可以使用它来满足对同一块的后续读/写请求,而不会引起实际磁盘I/O。脏缓冲区只有在被重新分配到不同的块时才会写人磁盘。

I/O缓冲区

typdef struct buf[
struct buf*next__free;// freelist pointer
struct buf *next__dev;// dev_list pointer int dev.,blk;
// assigmed disk block;int opcode;
// READ|wRITE int dirty;
// buffer data modified
int async;
// ASYNC write flag int valid;
//buffer data valid int buay;
// buffer is in use int wanted;
// some process needs this buffer struct semaphore lock=1; /
// buffer locking semaphore; value=1
struct semaphore iodone=0;// for process to wait for I/0 completion;// block data area char buf[BLKSIZE];)
} BUFFER;
BUFFER buf[NBUF],*freelist;// NBUF buffers and free buffer list

Unix缓冲区管理子系统

  • 设备表
struct devtab{
u16 dev;
// major device number // device buffer list BUFFER *dev_list;BUFFER*io_queue
// device I/0 queue ) devtab[NDEV];
  • Unix getblk/brelse算法
BUFFER *getblk(dev,blk){
    while(1){
     search dev_list for a bp=(dev,blk);
     if (bp in dev_lst)
       if(bp BUSY)
          set bp WANTED flag;
          sleep(bp);
          continue;
           }
      take bp put of freelist;
      mark bp BUSY;
      return bp;
}

Unix算法的优点:1.数据的一致性;2.缓存效果;3.临界区;

Unix算法的缺点:

  • 效率低下:该算法依赖于重试循环。例如,释放缓冲区可能会唤醒两组进程:需要释放的缓冲区的进程,以及只需要空闲缓冲区的进程。由于只有一个进程可以获取释放的缓冲区,所以,其他所有被唤醒的进程必须重新进入休眠状态。从休眠状态唤醒后,每个被唤醒的进程必须从头开始重新执行算法,因为所需的缓冲区可能已经存在。这会导致过多的进程切换。
  • 缓存效果不可预知:在Unix算法中,每个释放的缓冲区都可被获取。如果缓冲区由需要空闲绥冲区的进程获取,那么将会重新分配缓冲区.即使有些进程仍然需要当前的缓冲区。
  • 可能会出现饥饿:Unix算法基于"自由经济"原则,即每个进程都有尝试的机会,但不能保证成功。因此,可能会出现进程饥饿。
  • 该算法使用只适用于单处理器系统的休眠/唤醒操作。

Unix算法的一些具体说明:

  • 数据一致性:为了确保数据-致性,getblk一定不能给同一个(dev,blk)分配多个缓冲区。这可以通过让进程从休眠状态唤醒后再次执行“重试循环”来实现。读者可以验证分配的每个缓冲区都是唯一的。其次,脏缓冲区在重新分配之前被写出来,这保证了数据的一致性。

  • 缓存效果:缓存效果可通过以下方法实现。释放的缓冲区保留在设备列表中,以便可能重用。标记为延迟写入的缓冲区不会立即产生I/O、并且可以重用。缓冲区会被释放到空闲列表的末尾,但分配是从空闲列表的前面开始的。这是基于LRU(最近最少使用)原则, 它有助于延长所分配缓冲区的使用期,从而提高它们的缓存效果。

  • 临界区:设备中断处理程序可操作缓冲区列表,例如从设备表的I/O队列中删除 bp. 更改其状态并调用brelse(bp)。所以,在getblk和brelse中,设备中断在这些临界区中会被屏蔽。这些都是隐含的,但没有在算法中表现出来

新的I/O缓冲区管理算法

与休眠/唤醒相比,信号量的主要优点是:

  • 计数信号量可用来表示可用资源的数量,例如:空闲缓冲区的数量。

  • 当多个进程等待一个资源时,信号量上的V操作只会释放一个等待进程,该进程不必重试,因为它保证拥有资源。

使用信号量上的P/V来设计缓冲区管理算法要满足以下条件:

  • 缓冲区唯一性
  • 无重试循环
  • 无不必要唤醒
  • 缓存效果
  • 无死锁和饥饿

苏格拉底挑战

遇到的问题与解决方案

缓冲区溢出

  • 问题: 系统中的缓冲区数量有限,如果同时有多个进程请求大量的块设备I/O,可能导致缓冲区溢出,造成数据丢失或性能下降。
  • 解决方法: 可以调整系统参数,增加缓冲区的数量,或者采用更高效的缓冲区替换算法。另外,可以通过优化应用程序的I/O访问模式,减少对缓冲区的竞争。

脏缓冲区管理

  • 问题: 脏缓冲区包含未写入磁盘的数据,如果系统崩溃或发生其他故障,可能导致数据一致性问题。
  • 解决方法: 引入事务机制,确保在写入脏缓冲区时,同时记录相应的事务信息。这样,即使系统崩溃,可以通过事务日志进行恢复。另外,可以定期将脏缓冲区数据刷新到磁盘,以降低数据丢失的风险。

缓冲区的一致性

  • 问题: 多个进程可能同时访问同一个块,而其中一个进程修改了块的内容,这可能导致其他进程获取到不一致的数据。
  • 解决方法: 引入锁机制或其他同步机制,确保在一个缓冲区被修改时,其他进程无法同时访问它。这可以通过读写锁、互斥锁等手段来实现。

性能优化

  • 问题: 缓冲区管理的性能可能影响整体系统性能,特别是在高负载情况下。
  • 解决方法: 可以通过优化缓冲区替换算法、合理设置缓冲区大小、使用高性能的存储设备等方式来提高性能。定期监控系统的I/O性能并进行调优是很重要的。

数据一致性与性能平衡

  • 问题: 为了确保数据一致性,可能需要频繁地将脏缓冲区刷新到磁盘,但这可能影响性能。
  • 解决方法: 需要在数据一致性和性能之间进行权衡。可以采用一些延迟写入的策略,将脏缓冲区的刷新操作延迟到系统空闲时进行,以降低对性能的影响。

文件系统碎片

  • 问题: 频繁的块设备I/O可能导致文件系统碎片,影响磁盘空间的利用率。
  • 解决方法: 定期进行文件系统的整理和优化,可以使用工具进行碎片整理,以提高文件系统的性能和空间利用率。

实践过程


标签:10,Unix,笔记,学习,缓冲区,算法,dev,进程,磁盘
From: https://www.cnblogs.com/lizhuotong/p/17834283.html

相关文章

  • a=100作为形参传入,此时全局定义了var a = 100;var x变量提升至函数内部最前,形参x和变量
    请问以下JS代码输出的结果是什么?functionf(x){console.log(x);varx=200;console.log(x);}f(a=100);console.log(a);Aundefined、200、undefinedB100、200、undefinedC100、200、100Dundefined、200、100正确答案:CJS中的函数是非惰性求值,也就是说......
  • 2023-2024 20231313《计算机基础与程序设计》第八周学习总结
    2023-202420231313《计算机基础与程序设计》第八周学习总结作业速达作业课程班级链接作业要求计算机基础与程序设计第八周学习总结作业内容《计算机科学概论》第9章《C语言程序设计》第7章并完成云班课测试,功能设计与面向对象设计,面向对象设计过程,面向对象语......
  • 0到1000中能被2和3整除的数的和
    #include<stdio.h>intmain(){  inti,n=0;  for(i=0;i<=1000;i++)  {    if(i%2==0&&i%3==0)      n=n+i;      }  printf("%d",n);  return0;}......
  • DyHGCN:一种学习用户动态偏好的动态异构图卷积网络,用于信息扩散预测
    DyHGCN:ADynamicHeterogeneousGraphConvolutionalNetworktoLearnUsers’DynamicPreferencesforInformationDiffusionPredictionECML-PKDD2020欧洲机器学习与数据挖掘顶级会议Abstract​ 信息扩散预测是了解信息传播过程的一项基本任务。它在错误信息传播预测......
  • 【刷题笔记】110. Balanced Binary Tree
    题目Givenabinarytree,determineifitisheight-balanced.Forthisproblem,aheight-balancedbinarytreeisdefinedas:abinarytreeinwhichthedepthofthetwosubtreesofeverynodeneverdifferbymorethan1.Example1:Giventhefollowingtree......
  • NS-3源码学习(二)Channel和NetDevice
    NS-3源码学习(二)Channel和NetDevice对于一个新的802.11协议的实现,仅需要完成对两个抽象类的实现即可,一个是Channel抽象类,一个是NetDevice接口,这两个类对上层来说是透明的,而且据我查阅代码了解,这两个类仅需知道上一层(网络层)是IPv4协议还是IPv6协议即可,并没有对上层有更高的要求。M......
  • 零基础机器学习数字识别MNIST(on going)
    本人之前并未涉及机器学习,但是在嵌入式中都会涉及视觉,借校内比赛从零学习,进行MNIST数字识别模型的搭建。随着学习进度更新,每天更新。2023-11-1521:38:55星期三一、环境搭建进行本模型的搭建,需要以下内容:Python环境:利用Anaconda管理开源机器学习平台:PyTorch或Tensorf......
  • 洛谷p1090__合并果子
    合并果子可以作为mulitset的板子题 mulitset的accode#include<iostream>#include<set>usingnamespacestd;multiset<int,less<int>>m;intmain(){intn;cin>>n;for(inti=0;i<n;i++){intt;cin>......
  • 通过时序和上下文对比学习时间序列表征《Time-Series Representation Learning via Te
    现在是2023年11月14日的22:15,肝不动了,要不先回寝室吧,明天把这篇看了,然后把文档写了。OK,明天的ToDoList.现在是2023年11月15日的10:35,继续。论文:Time-SeriesRepresentationLearningviaTemporalandContextualContrasting(IJCAI官网版本PDF)或者是:Time-SeriesRepresenta......
  • 10--977. 有序数组的平方
    给你一个按 非递减顺序 排序的整数数组 nums,返回 每个数字的平方 组成的新数组,要求也按 非递减顺序 排序。 示例1:输入:nums=[-4,-1,0,3,10]输出:[0,1,9,16,100]解释:平方后,数组变为[16,1,0,9,100]排序后,数组变为[0,1,9,16,100]示例2:输入:nums=[-7,-3,2,3,11]......