首页 > 其他分享 >服务监控-开发眼里的磁盘io是什么

服务监控-开发眼里的磁盘io是什么

时间:2023-03-07 23:33:07浏览次数:50  
标签:监控 io 队列 cache IO 磁盘 请求

文件系统,磁盘io

服务监控系列文章

服务监控系列视频

作为开发对磁盘io的疑问

1, 如何发现,衡量磁盘的性能问题 ?
2,磁盘io延迟,该怎么办?

概念模型

image.png

image.png

直接io,裸io

直接io还是会经过文件系统,但是不经过pageCache。直接io用于备份文件时使用,这样不会污染文件系统cache,造成cache命中率下降。

裸io是直接绕过了文件系统,直接操作磁盘。

如何衡量磁盘io性能

从系统整体上看io

vmstat 或者top 命令看cache/buffer的值,top看 cpu wait 值大小

# vmstat
procs -----------------------memory---------------------- ---swap-- -----io---- -system-- --------cpu--------
 r  b         swpd         free         buff        cache   si   so    bi    bo   in   cs  us  sy  id  wa  st
 3  0            0      1503252       216428      6503928 

如果cache buffer的值长时间过低,说明系统缓冲命中率大大降低,很可能导致系统延迟。

使用率和饱和度

使用扩展模式寻找繁忙磁盘(超过60%使用率),较高的平均服务时间(超过大概10ms),以及高IOPS(可
能)。
```shell
iostat -x 1 

rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge);wrqm/s:每秒这个设备相关的写入请求有多少被Merge了。

rsec/s:每秒读取的扇区数;
wsec/:每秒写入的扇区数。
rKB/s:The number of read requests that were issued to the device per second;
wKB/s:The number of write requests that were issued to the device per second;
avgrq-sz 平均请求扇区的大小
avgqu-sz 是平均请求队列的长度。毫无疑问,队列长度越短越好。
await: 每一个IO请求的处理的平均时间(单位是微秒毫秒)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。
这个时间包括了队列时间和服务时间,也就是说,一般情况下,await大于svctm,它们的差值越小,则说明队列时间越短,反之差值越大,队列时间越长,说明系统出了问题。
svctm 表示平均每次设备I/O操作的服务时间(以毫秒为单位)。如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,如果await的值远高于svctm的值,则表示I/O队列等待太长, 系统上运行的应用程序将变慢。%util: 在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。

从进程角度看io

iotop 

go trace 工具可查看系统调用产生的延迟,如果从整体上看io达到了瓶颈,那么可以由这个工具来看系统在系统调用上消耗最多的地方来定位代码,以确定是否是此代码导致的io问题。

标签:监控,io,队列,cache,IO,磁盘,请求
From: https://www.cnblogs.com/hobbybear/p/17190193.html

相关文章

  • android stdio如何迁移device
    1.在C:\Users\(名字)\.android\avd文件中找到虚拟机文件复制且删除(由于我已经迁移完毕,只剩下一个.ini文件)  类似于这样的虚拟机文件。  2.将它复制或迁移到你希......
  • Vulnhub:Assertion-1.0.1靶机
    kali:192.168.111.111靶机:192.168.111.218信息收集端口扫描nmap-A-v-sV-T5-p---script=http-enum192.168.111.218查看index.php源码发现包含其他文件尝试包......
  • java.lang.IllegalStateException: Could not find method myClick(View) in a parent
    Android开发报错:java.lang.IllegalStateException:CouldnotfindmethodmyClick(View)inaparentorancestorContextforandroid:onClickattributedefinedonv......
  • Starrocks出现Lost connection to MySQL server during query
    背景:在调度中出现这个报错,但是在后台执行的时候是成功的,每次在调度上执行6分钟即360S的时候出现了这个报错,排查后发现使用的nginx代理中设置的timeout设置的是360s,所以......
  • Vision Transformer学习
    TransformerTransformer模型完全依赖于注意力机制,是编码器-解码器架构的一个实例。下面是整体架构图。它最重要的是自注意力层,为每两个token分配一个注意力值。在transfor......
  • 服务器软硬磁盘阵列
    概述: RAID(RedundantArrayofInexpensiveDisks)称为廉价磁盘冗余阵列。RAID的基本思想是把多个便宜的小磁盘组合到一起,组合为一个大磁盘组,使性能达到或超过一个容量巨......
  • 车牌识别(vehicle license plate recognition)
    车牌识别(vehiclelicenseplaterecognition)项目地址:https://github.com/jiangnanboy/vehicle_license_plate_recognition车牌识别系统:1.利用yolo5进行车牌检测2.利......
  • 软件工程日报十一——安卓studio的数据查询
    上一篇博客实现了安卓studio内数据的添加,这篇博客来实现数据的查询。mainactivity_main.xml文件<?xmlversion="1.0"encoding="utf-8"?><LinearLayoutxmlns:android=......
  • 《Spectral Partitioning Residual Network With Spatial Attention Mechanism for Hy
    论文作者:XiangrongZhang,ShouwangShang,XuTang,etal.论文发表年份:2021模型简称:SPRN发表期刊:IEEETransactionsonGeoscienceandRemoteSensing论文链接:Sci-Hub......
  • 音乐生成模型 Music generation
    目录-CoCoNet(2017)CoCoNet(2017)模型特点:使用卷积OrderlessNADE(NeuralAutoregressiveDistributionEstimators)吉布斯采样(GibbsSampling)XiaoIceBand(2018)A......