4 Redis持久化

标签：文件持久 AOF Redis RDB 数据

Redis 是一个内存数据库，所以其运行效率非常高。但也存在一个问题：内存中的数据是不持久的，若主机宕机或 Redis 关机重启，则内存中的数据全部丢失。当然，这是不允许的。Redis 具有持久化功能，其会按照设置以快照或操作日志的形式将数据持久化到磁盘。

根据持久化使用技术的不同，Redis 的持久化分为两种：RDB 与 AOF。

1 持久化基本原理

在这里插入图片描述
Redis 持久化也称为钝化，是指将内存中数据库的状态描述信息保存到磁盘中。只不过是不同的持久化技术，对数据的状态描述信息是不同的，生成的持久化文件也是不同的。但它们的作用都是相同的：避免数据意外丢失。

通过手动方式，或自动定时方式，或自动条件触发方式，将内存中数据库的状态描述信息写入到指定的持久化文件中。当系统重新启动时，自动加载持久化文件，并根据文件中数据库状态描述信息将数据恢复到内存中，这个数据恢复过程也称为激活。这个钝化与激活的过程就是 Redis 持久化的基本原理。

不过从以上分析可知，对于 Redis 单机状态下，无论是手动方式，还是定时方式或条件触发方式，都存在数据丢失问题：在尚未手动/自动保存时发生了 Redis 宕机状况，那么从上次保存到宕机期间产生的数据就会丢失。不同的持久化方式，其数据的丢失率也是不同的。

在这里插入图片描述

RDB 是默认持久化方式，但 Redis 允许 RDB 与 AOF 两种持久化技术同时开启，此时系统会使用 AOF 方式做持久化，即 AOF 持久化技术的优先级要更高。同样的道理，两种技术同时开启状态下，系统启动时若两种持久化文件同时存在，则优先加载 AOF持久化文件。

2 RDB 持久化

RDB，Redis DataBase，是指将内存中某一时刻的数据快照全量写入到指定的 rdb 文件的持久化技术。RDB 持久化默认是开启的。当 Redis 启动时会自动读取 RDB 快照文件，将数据从硬盘载入到内存，以恢复 Redis 关机前的数据库状态。

2.1 持久化的执行

RDB 持久化的执行有三种方式：手动 save 命令、手动 bgsave 命令，与自动条件触发。

（1 ）手动 save 命令
在这里插入图片描述
通过在 redis-cli 客户端中执行 save 命令可立即进行一次持久化保存。 save 命令在执行期间会阻塞 redis-server 进程，直至持久化过程完毕。而在 redis-server 进程阻塞期间，Redis不能处理任何读写请求，无法对外提供服务。

（2 ）手动 bgsave
在这里插入图片描述
通过在 redis-cli 客户端中执行 bgsave 命令可立即进行一次持久化保存。不同于 save 命令的是，正如该命令的名称一样，background save，后台运行 save。bgsave 命令会使服务器进程 redis-server 生成一个子进程，由该子进程负责完成保存过程。在子进程进行保存过程中，不会阻塞 redis-server 进程对客户端读写请求的处理。

（3 ）自动条件触发
自动条件触发的本质仍是 bgsave 命令的执行。只不过是用户通过在配置文件中做相应的设置后，Redis 会根据设置信息自动调用 bgsave 命令执行。具体配置方式，后面会详解。

（4 ）查看持久化时间
通过 lastsave 命令可以查看最近一次执行持久化的时间，其返回的是一个 Unix 时间戳
在这里插入图片描述

2.1.1 RDB 优化配置

RDB 相关的配置在 redis.conf 文件的 SNAPSHOTTING 部分。

在这里插入图片描述
（1 ） save

在这里插入图片描述
该配置用于设置快照的自动保存触发条件，即 save point，保存点。该触发条件是在指定时间段内发生了指定次数的写操作。除非另有规定，默认情况下持久化条件为 save 3600 1
300 100 60 10000。其等价于以下三条：

save 3600 1 # 在 3600 秒(1 小时)内发生 1 次写操作
save 300 100 # 在 300 秒(5 分钟)内发生 100 次写操作
save 60 10000 # 在 60 秒(1 分钟)内发生 1 万次写操作
如果不启用 RDB 持久化，只需设置 save 的参数为空串即可：save “”。

（2 ） stop-write-on-bgsave-error

在这里插入图片描述
默认情况下，如果 RDB 快照已启用（至少一个保存点），且最近的 bgsave 命令失败， Redis将停止接受写入。这样设置是为了让用户意识到数据没有正确地保存到磁盘上，否则很可能没有人会注意到，并会发生一些灾难。当然，如果 bgsave 命令后来可以正常工作了，Redis将自动允许再次写入。

（3 ） rdbcompression
在这里插入图片描述
当进行持久化时启用 LZF 压缩字符串对象。虽然压缩 RDB 文件会消耗系统资源，降低性能，但可大幅降低文件的大小，方便保存到磁盘，加速主从集群中从节点的数据同步。

（4 ） rdbchecksum

在这里插入图片描述
从 RDB5 开始， RDB 文件的 CRC64 校验和就被放置在了文件末尾。这使格式更能抵抗 RDB文件的损坏，但在保存和加载 RDB 文件时，性能会受到影响（约 10%），因此可以设置为 no禁用校验和以获得最大性能。在禁用校验和的情况下创建的 RDB 文件的校验和为零，这将告诉加载代码跳过校验检查。默认为 yes，开启了校验功能。

（5 ） sanitize-dump-payload
在这里插入图片描述
该配置用于设置在加载 RDB 文件或进行持久化时是否开启对 zipList、listPack 等数据的全面安全检测。该检测可以降低命令处理时发生系统崩溃的可能。其可设置的值有三种选择：

no：不检测
yes：总是检测
clients：只有当客户端连接时检测。排除了加载 RDB 文件与进行持久化时的检测。

默认值本应该是 clients，但其会影响 Redis 集群的工作，所以默认值为 no，不检测。

（6 ） dbfilename

在这里插入图片描述
指定 RDB 文件的默认名称，默认为 dump.rdb。

（7） dir
在这里插入图片描述
指定 RDB 与 AOF 文件的生成目录。默认为 Redis 安装根目录。

2.1.2 RDB 文件结构

RDB 持久化文件 dump.rdb 整体上有五部分构成：

在这里插入图片描述
（1 ） SOF
SOF 是一个常量，一个字符串 REDIS，仅包含这五个字符，其长度为 5。用于标识 RDB文件的开始，以便在加载 RDB 文件时可以迅速判断出文件是否是 RDB 文件。
（2 ） rdb_version
这是一个整数，长度为 4 字节，表示 RDB 文件的版本号。
（3 ） EOF
EOF 是一个常量，占 1 个字节，用于标识 RDB 数据的结束，校验和的开始。
（4 ） check_sum
校验和 check_sum 用于判断 RDB 文件中的内容是否出现数据异常。其采用的是 CRC 校验算法。
（5 ） databases

在这里插入图片描述
databases 部分是 RDB 文件中最重要的数据部分，其可以包含任意多个非空数据库。而每个 database 又是由三部分构成：

SODB：是一个常量，占 1 个字节，用于标识一个数据库的开始。
db_number：数据库编号。
key_value_pairs：当前数据库中的键值对数据。

在这里插入图片描述
每个 key_value_pairs 又由很多个用于描述键值对的数据构成。

VALUE_TYPE：是一个常量，占 1 个字节，用于标识该键值对中 value 的类型。
EXPIRETIME_UNIT：是一个常量，占 1 个字节，用于标识过期时间的单位是秒还是毫秒。
time：当前 key-value 的过期时间。

2.1.3 RDB 持久化过程

在这里插入图片描述
于 Redis 默认的 RDB 持久化，在进行 bgsave 持久化时，redis-server 进程会 fork 出一个 bgsave 子进程，由该子进程以异步方式负责完成持久化。而在持久化过程中，redis-server进程不会阻塞，其会继续接收并处理用户的读写请求。

bgsave 子进程的详细工作原理如下：
由于子进程可以继承父进程的所有资源，且父进程不能拒绝子进程的继承权。所以，bgsave 子进程有权读取到 redis-server 进程写入到内存中的用户数据，使得将内存数据持久化到 dump.rdb 成为可能。
bgsave 子进程在持久化时首先会将内存中的全量数据 copy 到磁盘中的一个 RDB 临时文件，copy 结束后，再将该文件 rename 为 dump.rdb，替换掉原来的同名文件。

在这里插入图片描述

3 AOF持久化

AOF，Append Only File，是指 Redis 将每一次的写操作都以日志的形式记录到一个 AOF文件中的持久化技术。当需要恢复内存数据时，将这些写操作重新执行一次，便会恢复到之前的内存数据状态。

3.1 AOF 基本配置

（1 ） AOF 的开启

在这里插入图片描述
默认情况下 AOF 持久化是没有开启的，通过修改配置文件中的 appendonly 属性为 yes可以开启。

（2 ）文件名配置

在这里插入图片描述
Redis 7 在这里发生了重大变化。原来只有一个 appendonly.aof 文件，现在具有了三类多个文件：

基本文件：可以是 RDF 格式也可以是 AOF 格式。其存放的内容是由 RDB 转为 AOF 当时内存的快照数据。该文件可以有多个。
增量文件：以操作日志形式记录转为 AOF 后的写入操作。该文件可以有多个。
清单文件：用于维护 AOF 文件的创建顺序，保障激活时的应用顺序。该文件只有一个。

（3 ）混合式持久化开启

在这里插入图片描述
对于基本文件可以是 RDF 格式也可以是 AOF 格式。通过 aof-use-rdb-preamble 属性可以选择。其默认值为 yes，即默认 AOF 持久化的基本文件为 rdb 格式文件，也就是默认采用混合式持久化。

（4 ） AOF 文件目录配置
在这里插入图片描述
为了方便管理，可以专门为 AOF 持久化文件指定存放目录。目录名由 appenddirname属性指定，存放在 redis.conf 配置文件的 dir 属性指定的目录，默认为 Redis 安装目录。

3.2 AOF文件格式

增量文件扩展名为.aof，采用 AOF 格式。AOF 格式其实就是 Redis 通讯协议格式，AOF持久化文件的本质就是基于 Redis 通讯协议的文本，将命令以纯文本的方式写入到文件中。
Redis 协议规定， Redis 文本是以行来划分，每行以\r\n 行结束。每一行都有一个消息头，以表示消息类型。消息头由六种不同的符号表示，其意义如下：

(+) 表示一个正确的状态信息
(-) 表示一个错误信息
(*) 表示消息体总共有多少行，不包括当前行
($) 表示下一行消息数据的长度，不包括换行符长度\r\n
(空) 表示一个消息数据
( : ) 表示返回一个数值

（2 ）查看 AOF文件
打开 appendonly.aof.1.incr.aof 文件，可以看到如下格式内容。

在这里插入图片描述
以上内容中框起来的是三条命令。一条数据库切换命令 SELECT 0，两条 set 命令。它们的意义如下：

*2 -- 表示当前命令包含 2 个参数
$6 -- 表示第1个参数包含6个字符
SELECT -- 第 1个参数
$1 -- 表示第2个参数包含1个字符
0 -- 第2个参数
*3 --表示当前命令包含3个参数
$3 -- 表示第1个参数包含3个字符
set -- 第1个参数
$3 -- 表示第1个参数包含3个字符
k11 -- 第2个参数
$3 -- 表示第3个参数包含2个字符
v11 -- 第3个参数

（3 ）清单文件
打开清单文件 appendonly.aof.manifest，查看其内容如下：
在这里插入图片描述

该文件首先会按照 seq 序号列举出所有基本文件，基本文件 type 类型为 b，然后再按照seq 序号再列举出所有增量文件，增量文件 type 类型为 i。
对于 Redis 启动时的数据恢复，也会按照该文件由上到下依次加载它们中的数据。

3.3 AOF优化配置

（1 ） appendfsync
加粗样式

客户端提交写操作命令后，该命令就会写入到 aof_buf 中，而 aof_buf 中的数据持久化到磁盘 AOF 文件的过程称为数据同步。
何时将 aof_buf 中的数据同步到 AOF 文件？采用不同的数据同步策略，同时的时机是不同的，有三种策略：

always：写操作命令写入 aof_buf 后会立即调用 fsync()系统函数，将其追加到 AOF 文件。
该策略效率较低，但相对比较安全，不会丢失太多数据。最多就是刚刚执行过的写操作在尚未同步时出现宕机或重启，将这一操作丢失。
no：写操作命令写入 aof_buf 后什么也不做，不会调用 fsync()函数。而将 aof_buf 中的数据同步磁盘的操作由操作系统负责。Linux 系统默认同步周期为 30 秒。效率较高。
everysec：默认策略。写操作命令写入 aof_buf 后并不直接调用 fsync()，而是每秒调用一次 fsync()系统函数来完成同步。该策略兼顾到了性能与安全，是一种折中方案。

（2 ） no-appendfsync-on-rewrite

在这里插入图片描述
该属性用于指定，当 AOF fsync 策略设置为 always 或 everysec，当主进程创建了子进程正在执行 bgsave 或 bgrewriteaof 时，主进程是否不调用 fsync()来做数据同步。设置为 no，双重否定即肯定，主进程会调用 fsync()做同步。而 yes 则不会调用 fsync()做数据同步。

（3 ） aof-rewrite-incremental-fsync
在这里插入图片描述
当 bgrewriteaof 在执行过程也是先将 rewrite 计算的结果写入到了 aof_rewrite_buf 缓存中，然后当缓存中数据达到一定量后就会调用 fsync()进行刷盘操作，即数据同步，将数据写入到临时文件。该属性用于控制 fsync()每次刷盘的数据量最大不超过 4MB。这样可以避免由于单次刷盘量过大而引发长时间阻塞。

3.4AOF持久化过程

在这里插入图片描述
AOF 详细的持久化过程如下：

Redis 接收到的写操作命令并不是直接追加到磁盘的 AOF 文件的，而是将每一条写命令按照 redis 通讯协议格式暂时添加到 AOF 缓冲区 aof_buf。
根据设置的数据同步策略，当同步条件满足时，再将缓冲区中的数据一次性写入磁盘的AOF 文件，以减少磁盘 IO 次数，提高性能。
当磁盘的 AOF 文件大小达到了 rewrite 条件时， redis-server 主进程会 fork 出一个子进程bgrewriteaof，由该子进程完成 rewrite 过程。
子进程 bgrewriteaof 首先对该磁盘 AOF 文件进行 rewrite 计算，将计算结果写入到一个临时文件，全部写入完毕后，再 rename 该临时文件为磁盘文件的原名称，覆盖原文件。
如果在 rewrite 过程中又有写操作命令追加，那么这些数据会暂时写入 aof_rewrite_buf缓冲区。等将全部 rewrite 计算结果写入临时文件后，会先将 aof_rewrite_buf 缓冲区中的数据写入临时文件，然后再 rename 为磁盘文件的原名称，覆盖原文件。

4 RDB 与与 AOF 对比

4.1 RDB 优势与不足

（1 ） RDB 优势

RDB 文件较小
数据恢复较快
（2 ） RDB 不足
数据安全性较差
写时复制会降低性能
RDB 文件可读性较差

4.2 AOF 优势与不足

（1 ） AOF 优势

数据安全性高
AOF 文件可读性强
（2 ） AOF 不足
AOF 文件较大
写操作会影响性能
数据恢复较慢

5 持久化技术选型

官方推荐使用 RDB 与 AOF 混合式持久化。
若对数据安全性要求不高，则推荐使用纯 RDB 持久化方式。
不推荐使用纯 AOF 持久化方式。
若 Redis 仅用于缓存，则无需使用任何持久化技术。

标签：文件,持久,AOF,Redis,RDB,数据
From： https://blog.csdn.net/2301_76721962/article/details/136848092

1 持久化基本原理

2 RDB 持久化

2.1 持久化的执行

2.1.1 RDB 优化配置

2.1.2 RDB 文件结构

2.1.3 RDB 持久化过程

3 AOF持久化

3.1 AOF 基本配置

3.2 AOF文件格式

3.3 AOF优化配置

3.4AOF持久化过程

4 RDB 与与 AOF 对比

4.1 RDB 优势与不足

4.2 AOF 优势与不足

5 持久化技术选型

相关文章

赞助商

阅读排行

4 Redis持久化

1 持久化基本原理

2 RDB 持久化

2.1 持久化的执行

2.1.1 RDB 优化配置

2.1.2 RDB 文件结构

2.1.3 RDB 持久化过程

3 AOF持久化

3.1 AOF 基本配置

3.2 AOF文件格式

3.3 AOF优化配置

3.4AOF持久化过程

4 RDB 与 与 AOF 对比

4.1 RDB 优势与不足

4.2 AOF 优势与不足

5 持久化技术选型

相关文章

赞助商

阅读排行

4 RDB 与与 AOF 对比