首页 > 系统相关 >Linux操作系统优化 I/O调度,透明大页,swap,NUMA

Linux操作系统优化 I/O调度,透明大页,swap,NUMA

时间:2023-11-15 20:00:57浏览次数:31  
标签:kernel 大页 请求 调度 sys swap Linux root transparent

I/O调度的4种算法

对于固态硬盘来说使用NOOP是最好的,DeadLine次之,而CFQ效率最低。

CFQ(完全公平排队I/O调度程序)

特点:

在最新的内核版本和发行版中,都选择CFQ做为默认的I/O调度器,对于通用的服务器也是最好的选择.

CFQ试图均匀地分布对I/O带宽的访问,避免进程被饿死并实现较低的延迟,是deadline和as调度器的折中.

CFQ对于多媒体应用(video,audio)和桌面系统是最好的选择.

CFQ赋予I/O请求一个优先级,而I/O优先级请求独立于进程优先级,高优先级的进程的读写不能自动地继承高的I/O优先级.

工作原理:

CFQ为每个进程/线程,单独创建一个队列来管理该进程所产生的请求,也就是说每个进程一个队列,各队列之间的调度使用时间片来调度,

以此来保证每个进程都能被很好的分配到I/O带宽.I/O调度器每次执行一个进程的4次请求.

NOOP(电梯式调度程序)

特点:

在Linux2.4或更早的版本的调度程序,那时只有这一种I/O调度算法.

NOOP实现了一个简单的FIFO队列,它像电梯的工作主法一样对I/O请求进行组织,当有一个新的请求到来时,它将请求合并到最近的请求之后,以此来保证请求同一介质.

NOOP倾向饿死读而利于写.

NOOP对于闪存设备,RAM,嵌入式系统是最好的选择.

电梯算法饿死读请求的解释:

因为写请求比读请求更容易.

写请求通过文件系统cache,不需要等一次写完成,就可以开始下一次写操作,写请求通过合并,堆积到I/O队列中.

读请求需要等到它前面所有的读操作完成,才能进行下一次读操作.在读操作之间有几毫秒时间,而写请求在这之间就到来,饿死了后面的读请求.

Deadline(截止时间调度程序)

特点:

通过时间以及硬盘区域进行分类,这个分类和合并要求类似于noop的调度程序.

Deadline确保了在一个截止时间内服务请求,这个截止时间是可调整的,而默认读期限短于写期限.这样就防止了写操作因为不能被读取而饿死的现象.

Deadline对数据库环境(ORACLE RAC,MYSQL等)是最好的选择.

AS(预料I/O调度程序)

特点:

本质上与Deadline一样,但在最后一次读操作后,要等待6ms,才能继续进行对其它I/O请求进行调度.

可以从应用程序中预订一个新的读请求,改进读操作的执行,但以一些写操作为代价.

它会在每个6ms中插入新的I/O操作,而会将一些小写入流合并成一个大写入流,用写入延时换取最大的写入吞吐量.

AS适合于写入较多的环境,比如文件服务器

AS对数据库环境表现很差.

修改linux I/O 调度器

修改Linux系统的 I/O调度器有三种方法,分别是使用shell命令、使用grubby命令或者修改grub配置文件

使用shell临时修改

echo noop > /sys/block/sda/queue/scheduler

如果想永久修改也可以再开机启动中添加 vim /etc/rc.local

echo noop > /sys/block/sdb/queue/scheduler

查看修改后的效果

cat /sys/block/sda/queue/scheduler

使用grubby命令修改

grubby --grub --update-kernel=ALL --args=“elevator=cfq”

使用vi编辑器修改配置文件

vi /etc/default/grub

GRUB_CMDLINE_LINUX=“rd.lvm.lv=rhel/root rd.lvm.lv=rhel/swap rhgb quiet transparent_hugepage=neverelevator=deadline”

grub2-mkconfig -o /boot/grub2/grub.cfg

重启系统

磁盘预读

除了根据不同应用场景,配置磁盘的I/O调度方式之外,还可以通过调整Linux内核预读磁盘扇区参数进行I/O的优化。在内存中读取数据比从磁盘读取要快很多,增加Linux内核预读,对于大量顺序读取的操作,可以有效减少I/O的等待时间。如果应用场景中有大量的碎片小文件,过多的预读会造成资源的浪费。所以该值应该在实际环境多次测试。

查看
[root@pghost1 ~]# /sbin/blockdev --getra /dev/sda
修改
[root@pghost1 ~]# /sbin/blockdev --setra 16384 /dev/sda
或者
[root@pghost1 ~]# echo 16384 /sys/block/sda/queue/read_ahead_kb
为防止重启失效,可以将配置写入/etc/rc.local文件

内存

swap

在内存方面,对数据库性能影响最恶劣的就是Swap了。当内存不足,操作系统会将虚拟内存写入磁盘进行内存交换,而数据库并不知道数据在磁盘中,这种情况下就会导致性能急剧下降,甚至造成生产故障。有些系统管理员会彻底禁用Swap,但如果这样,一旦内存消耗完就会导致OOM,数据库也会随之崩溃。

[root@host1 ~]# free 
              total        used        free      shared  buff/cache   available
Mem:        1863020     1340536       76284      264872      446200      108492
Swap:             0           0           0
[root@host1 ~]# swapoff -a 
[root@host1 ~]# swapon
[root@host1 ~]#

透明大页

透明大页(Transparent HugePages)在运行时动态分配内存,而运行时的内存分配会有延误,对于数据库管理系统来说并不友好,所以建议关闭透明大页。

查看与关闭
[root@host1 ~]# cat /sys/kernel/mm/transparent_hugepage/enabled
[always] madvise never
[root@host1 ~]# echo never > /sys/kernel/mm/transparent_hugepage/enabled

[root@host1 ~]# 
[root@host1 ~]# cat /sys/kernel/mm/transparent_hugepage/enabled
always madvise [never]
[root@host1 ~]# 

永久禁用
编辑/etc/rc.local,加入以下内容:
if test -f /sys/kernel/mm/transparent_hugepage/enabled; then
    echo never > /sys/kernel/mm/transparent_hugepage/enabled
fi
if test -f /sys/kernel/mm/transparent_hugepage/defrag; then
    echo never > /sys/kernel/mm/transparent_hugepage/defrag
fi
还可以通过修改/etc/grub.conf,在kernel的行末加上transparent_hugepage=never禁用透明大页

NUMA

NUMA架构会优先在请求线程所在的CPU的local内存上分配空间,如果local内存不足,优先淘汰local内存中无用的页面,这会导致每个CPU上的内存分配不均,虽然可以通过配置NUMA的轮询机制缓解,但对于数据库管理系统仍不又好,建议关闭NUMA。

查看
numactl --hardware
或者
numastat

可以通过编辑/etc/grub.conf,在kernel的行末加上numa=off禁用NUMA

标签:kernel,大页,请求,调度,sys,swap,Linux,root,transparent
From: https://blog.51cto.com/u_13482808/8406752

相关文章

  • Linux系统Keepalive Nginx做前置机配置
     1、软件官网下载https://www.keepalived.org/download.htmlhttp://nginx.org/download/选择软件版本如下[root@ZE-NGXFR01data]#lltotal1960-rw-------1sysadmsysadm927631Nov1510:34keepalived-2.0.10.tar.gz-rw-------1sysadmsysadm1073322Nov1511:01......
  • Linux管理员密码恢复
    Linux管理员密码恢复在大多数的linux中在GRUB界面按下e键,进入启动命令编辑模式,在这里一般有下面这三行东西: 其中:第一行root行表示了指定根目录为哪个盘那个分区第二行kernel行表示了要加载的内核文件第三行initrd行表示了指定要加载的初始内存文件系统文件,用于在启动过程中......
  • putty连接linux时慢
    情况描述:putty连接rhel6/7时输入用户可能会等待10-30秒才有提示输入密码解决办法:vi/etc/ssh/sshd_config###找到GSSAPIAuthenticationyes,修改为GSSAPIAuthenticationno###注意,这里你也需要将UseDNS修改为no,CentOS默认是yes,即使这行已被注释,你也需要加上UseDNSno ......
  • linux Libevent 轻量级事件通知库API简介和示例
    1.事件处理框架libevent是一个C语言编写,轻量级开源高性能事件框架。事件驱动,支持多种IO多路复用(如epoll),支持注册优先级等//头文件#include<event2/event.h>//创建一个事件处理框架structevent_base*event_base_new(void);//销毁一个事件处理框架voidevent_ba......
  • Linux I/O重定向与管道详解
    原理
在Linux中,I/O重定向是通过重定向符号实现的。标准输入重定向使用符号“<”,标准输出重定向使用符号“>”。
例如,将文件file.txt的内容输出到终端,可以使用以下命令:catfile.txt将文件file.txt的内容输出到文件output.txt,可以使用以下命令:catfile.txt>output.txt管......
  • Linux网关设置
    你需要将网卡为en1,IP地址为192.168.3.12,网关为192.168.3.1的路由策略设置为在访问192.168.3.0/24网段时走en1网卡,那么你可以通过下面的命令设置: ......
  • Linux文件管理详解
    Linux文件系统的体系结构
Linux文件系统采用层次结构,从根目录(/)开始,包含多个子目录和文件。文件系统之间通过虚拟文件系统(VFS)进行通信,VFS使得Linux可以支持多个不同的文件系统,每个表示一个VFS的通用接口。Linux文件系统组成
Linux文件系统主要由以下几部分组成:1. 文件:文件是存......
  • Linux公共账户管理详解
    Linux公共账户管理简介
Linux公共账户管理是Linux系统管理中的重要环节,涉及到系统的安全性和稳定性。在Linux系统中,每个用户都有一个唯一的用户名和密码,用于登录系统并执行各种操作。公共账户管理的主要任务包括账户的创建、删除、权限设置、密码管理等。
Linux公共账户管理操......
  • Linux文件权限管理详解
    Linux文件权限表示方式
在Linux系统中,文件权限使用数字表示法,每组权限用三位二进制数表示,分别为文件所有者的读、写和执行权限;和所有者同组的用户的读、写和执行权限;系统中其他用户的读、写和执行权限。
例如,一个文件的权限为755,表示文件所有者具有读、写、执行权限(7),同组用户具......
  • Linux下make工具的使用
    环境:Ubuntu18.04.6文章参考:爱编程的大丙(subingwen.cn)简介:gcc命令可以帮助我们编译源文件,但当源文件数量多到一定程度时,使用gcc命令就会变得较为复杂。项目构建工具make应运而生,make是一个命令工具,用于解释makefile中指令的命令工具。在构建项目时,make工具会自动加载当......