知识点归纳

第12章块设备I/O和缓冲区管理

块设备和I/O缓冲区

由于与内存访问相比，磁盘I/O速度较慢，所以不希望再每次执行读写文件操作时都执行磁盘I/O。因此，大多数文件系统使用I/O缓冲来减少存储设备的物理I/O数量。合理设计的I/O缓方案可显著提高文件I/O缓冲方案可显著提高文件I/O效率并增加系统吞吐量。
I/O缓冲的基本原理非常简单。文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取（dev，blk）标识的磁盘块时，它首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果该缓冲区存在并且包含有效数据，那么它只需从缓冲区中读取数据，而无须再次从磁盘中读取数据块。如果该缓冲区不存在，它会为磁盘块分配一个缓冲区，将数据从磁盘读入缓冲区，然后从缓冲区读取数据。当某个块被读入时，该缓冲区将被保存在缓冲区缓存中。以供任意进程对同一个块的下一次读/写请求使用。同样，当进程写入磁盘块时，它首先会获取一个分配给该块的缓冲区。然后，它将数据写人缓冲区，将缓冲区标记为脏，以延迟写入，并将其释放到缓冲区缓存中。由于脏缓冲区包含有效的数据，因此可以使用它来满足对同一块的后续读/写请求，而不会引起实际磁盘I/O。脏缓冲区只有在被重新分配到不同的块时才会写人磁盘。

I/O缓冲区

typdef struct buf[
struct buf*next__free;// freelist pointer
struct buf *next__dev;// dev_list pointer int dev.,blk;
// assigmed disk block;int opcode;
// READ|wRITE int dirty;
// buffer data modified
int async;
// ASYNC write flag int valid;
//buffer data valid int buay;
// buffer is in use int wanted;
// some process needs this buffer struct semaphore lock=1; /
// buffer locking semaphore; value=1
struct semaphore iodone=0;// for process to wait for I/0 completion;// block data area char buf[BLKSIZE];)
} BUFFER;
BUFFER buf[NBUF],*freelist;// NBUF buffers and free buffer list

Unix缓冲区管理子系统

设备表

struct devtab{
u16 dev;
// major device number // device buffer list BUFFER *dev_list;BUFFER*io_queue
// device I/0 queue ) devtab[NDEV];

Unix getblk/brelse算法

BUFFER *getblk(dev,blk){
    while(1){
     search dev_list for a bp=(dev,blk);
     if (bp in dev_lst)
       if(bp BUSY)
          set bp WANTED flag;
          sleep(bp);
          continue;
           }
      take bp put of freelist;
      mark bp BUSY;
      return bp;
}

Unix算法的优点：1.数据的一致性；2.缓存效果；3.临界区；

Unix算法的缺点：

效率低下：该算法依赖于重试循环。例如，释放缓冲区可能会唤醒两组进程：需要释放的缓冲区的进程，以及只需要空闲缓冲区的进程。由于只有一个进程可以获取释放的缓冲区，所以，其他所有被唤醒的进程必须重新进入休眠状态。从休眠状态唤醒后，每个被唤醒的进程必须从头开始重新执行算法，因为所需的缓冲区可能已经存在。这会导致过多的进程切换。
缓存效果不可预知：在Unix算法中，每个释放的缓冲区都可被获取。如果缓冲区由需要空闲绥冲区的进程获取，那么将会重新分配缓冲区．即使有些进程仍然需要当前的缓冲区。
可能会出现饥饿：Unix算法基于"自由经济"原则，即每个进程都有尝试的机会，但不能保证成功。因此，可能会出现进程饥饿。
该算法使用只适用于单处理器系统的休眠／唤醒操作。

Unix算法的一些具体说明:

数据一致性：为了确保数据－致性，getblk一定不能给同一个(dev,blk)分配多个缓冲区。这可以通过让进程从休眠状态唤醒后再次执行“重试循环”来实现。读者可以验证分配的每个缓冲区都是唯一的。其次，脏缓冲区在重新分配之前被写出来，这保证了数据的一致性。
缓存效果：缓存效果可通过以下方法实现。释放的缓冲区保留在设备列表中，以便可能重用。标记为延迟写入的缓冲区不会立即产生I/O、并且可以重用。缓冲区会被释放到空闲列表的末尾，但分配是从空闲列表的前面开始的。这是基于LRU（最近最少使用）原则，它有助于延长所分配缓冲区的使用期，从而提高它们的缓存效果。
临界区：设备中断处理程序可操作缓冲区列表，例如从设备表的I/O队列中删除 bp. 更改其状态并调用brelse(bp)。所以，在getblk和brelse中，设备中断在这些临界区中会被屏蔽。这些都是隐含的，但没有在算法中表现出来

新的I/O缓冲区管理算法

与休眠/唤醒相比，信号量的主要优点是：

计数信号量可用来表示可用资源的数量，例如：空闲缓冲区的数量。
当多个进程等待一个资源时，信号量上的V操作只会释放一个等待进程，该进程不必重试，因为它保证拥有资源。

使用信号量上的P/V来设计缓冲区管理算法要满足以下条件:

缓冲区唯一性
无重试循环
无不必要唤醒
缓存效果
无死锁和饥饿

苏格拉底挑战

遇到的问题与解决方案

缓冲区溢出：

问题：系统中的缓冲区数量有限，如果同时有多个进程请求大量的块设备I/O，可能导致缓冲区溢出，造成数据丢失或性能下降。
解决方法：可以调整系统参数，增加缓冲区的数量，或者采用更高效的缓冲区替换算法。另外，可以通过优化应用程序的I/O访问模式，减少对缓冲区的竞争。

脏缓冲区管理：

问题：脏缓冲区包含未写入磁盘的数据，如果系统崩溃或发生其他故障，可能导致数据一致性问题。
解决方法：引入事务机制，确保在写入脏缓冲区时，同时记录相应的事务信息。这样，即使系统崩溃，可以通过事务日志进行恢复。另外，可以定期将脏缓冲区数据刷新到磁盘，以降低数据丢失的风险。

缓冲区的一致性：

问题：多个进程可能同时访问同一个块，而其中一个进程修改了块的内容，这可能导致其他进程获取到不一致的数据。
解决方法：引入锁机制或其他同步机制，确保在一个缓冲区被修改时，其他进程无法同时访问它。这可以通过读写锁、互斥锁等手段来实现。

性能优化：

问题：缓冲区管理的性能可能影响整体系统性能，特别是在高负载情况下。
解决方法：可以通过优化缓冲区替换算法、合理设置缓冲区大小、使用高性能的存储设备等方式来提高性能。定期监控系统的I/O性能并进行调优是很重要的。

数据一致性与性能平衡：

问题：为了确保数据一致性，可能需要频繁地将脏缓冲区刷新到磁盘，但这可能影响性能。
解决方法：需要在数据一致性和性能之间进行权衡。可以采用一些延迟写入的策略，将脏缓冲区的刷新操作延迟到系统空闲时进行，以降低对性能的影响。

文件系统碎片：

问题：频繁的块设备I/O可能导致文件系统碎片，影响磁盘空间的利用率。
解决方法：定期进行文件系统的整理和优化，可以使用工具进行碎片整理，以提高文件系统的性能和空间利用率。

实践过程

标签：10,Unix,笔记,学习,缓冲区,算法,dev,进程,磁盘
From： https://www.cnblogs.com/lizhuotong/p/17834283.html

学习笔记10

知识点归纳

第12章块设备I/O和缓冲区管理

块设备和I/O缓冲区

Unix缓冲区管理子系统

Unix算法的优点：1.数据的一致性；2.缓存效果；3.临界区；

Unix算法的缺点：

Unix算法的一些具体说明:

新的I/O缓冲区管理算法

苏格拉底挑战

遇到的问题与解决方案

实践过程

相关文章

赞助商

阅读排行

学习笔记10

知识点归纳

第12章 块设备I/O和缓冲区管理

块设备和I/O缓冲区

Unix缓冲区管理子系统

Unix算法的优点：1.数据的一致性；2.缓存效果；3.临界区；

Unix算法的缺点：

Unix算法的一些具体说明:

新的I/O缓冲区管理算法

苏格拉底挑战

遇到的问题与解决方案

实践过程

相关文章

赞助商

阅读排行

第12章块设备I/O和缓冲区管理