redis 02：Redis的持久化

标签：02 文件持久 AOF Redis redis aof 重写

文章目录

一、Redis的持久化机制
二、Redis持久化

2.1 RDB快照（snapshot）
2.2 AOF（append-only file）

三、Redis 4.0 混合持久化
四、redis启动加载持久化
五、小总结：
六、性能建议（这里只针对单机版redis持久化做性能建议）：

以下参考了图灵学院的学习总结，图灵学院挺好的，值得报班！

一、Redis的持久化机制

就是在指定的时间间隔内，将内存当中的数据集快照写入磁盘，它恢复时是将快照文件直接读到内存

什么意思呢？我们都知道，内存当中的数据，如果我们一断电，那么数据必然会丢失，但是玩过redis的同学应该都知道，我们一关机之后再启动的时候数据是还在的，所以它必然是在redis启动的时候重新去加载了持久化的文件

redis 02：Redis的持久化_数据

二、Redis持久化

一种是RDB持久化默认，

另外一种是AOF（append only file）持久化。

redis 02：Redis的持久化_数据_02

2.1 RDB快照（snapshot）

1.概念
在默认情况下， Redis 将内存数据库快照保存在名字为 dump.rdb的二进制文件中。

原理是redis会单独创建（fork）一个与当前进程一模一样的子进程来进行持久化，这个子进程的所有数据（变量，环境变量，程序程序计数器等）都和原进程一模一样，会先将数据写入到一个临时文件中，待持久化结束了，再用这个临时文件替换上次持久化好的文件，整个过程中，主进程不进行任何的io操作，这就确保了极高的性能。

持久化rdb文件位置：

redis 02：Redis的持久化_持久化_03

redis 02：Redis的持久化_Redis_04

可以对 Redis 进行设置，让它在 “N 秒内数据集至少有 M个改动” 这一条件被满足时，自动保存一次数据集。

修改redis.conf文件：

redis 02：Redis的持久化_Redis_05

2.触发时机
他什么时候fork子进程，或者什么时候触发rdb持久化机制：
（1）shutdown时，如果没有开启aof，会触发配置文件中默认的快照配置
（2）执行命令save或者bgsave；save是只管保存，其他不管，全部阻塞；bgsave：redis会在后台异步进行快照操作，同时可以不响应客户端的请求
（3）执行flushall命令但是里面是空的，无意义

手动执行命令生成RDB快照，进入redis客户端执行命令save或bgsave可以生成dump.rdb文件，每次命令执行都会将所有redis内存快照到一个新的rdb文件里，并覆盖原有rdb快照文件;

3.bgsave的写时复制(COW)机制
Redis 借助操作系统提供的写时复制技术（Copy-On-Write,COW），在生成快照的同时，依然可以正常处理写命令。简单来说，bgsave子进程是由主线程 fork 生成的，可以共享主线程的所有内存数据。 bgsave子进程运行后，开始读取主线程的内存数据，并把它们写入 RDB文件。此时，如果主线程对这些数据也都是读操作，那么，主线程和 bgsave子进程相互不影响。但是，如果主线程要修改一块数据，那么，这块数据就会被复制一份，生成该数据的副本。然后，bgsave子进程会把这个副本数据写入 RDB文件，而在这个过程中，主线程仍然可以直接修改原来的数据。

save与bgsave对比：

redis 02：Redis的持久化_redis_06

配置自动生成rdb文件后台使用的是bgsave方式。

2.2 AOF（append-only file）

1.aof是什么？
快照功能并不是非常耐久（durable）：如果 Redis 因为某些原因而造成故障停机，那么服务器将丢失最近写入、且仍未保存到快照中的那些数据。从1.1 版本开始， Redis 增加了一种完全耐久的持久化方式： AOF 持久化，将修改的每一条指令记录进文件appendonly.aof中(先写入os cache，每隔一段时间fsync到磁盘)

（1）比如执行命令"set zhuge 666"，aof文件里会记录如下数据：

1 *3
2 set
3 $5
4 zhuge
5 $3
6 666

这是一种resp协议格式数据，*号后面的数字代表命令有多少个参数，$号后面的数字代表这个参数有几个字符

注意，如果执行带过期时间的set命令，aof文件里记录的是并不是执行的原始命令，而是记录key过期的时间戳

（2）比如执行 “set tuling 888 ex 1000”，对应aof文件里记录如下：

*3
$3
set
$6
tuling
$3
888
*3
$9
PEXPIREAT
$6
tuling
$13
1604249786301

原理就是将Reids的操作日志以追加的方式写入文件，读操作是不记录的。

2.修改配置

修改redis.conf配置文件来打开 AOF 功能：

redis 02：Redis的持久化_数据_07

可以直接指定位置，和rdb一样

redis 02：Redis的持久化_redis_08

3.触发机制（根据配置文件配置项）

从现在开始，每当 Redis 执行一个改变数据集的命令时（比如SET），这个命令就会被追加到AOF 文件的末尾。

这样的话，当 Redis 重新启动时，程序就可以通过重新执行 AOF文件中的命令来达到重建数据集的目的。

你可以配置 Redis 多久才将数据 fsync 到磁盘一次。

redis 02：Redis的持久化_redis_09

no：表示等操作系统进行数据缓存同步到磁盘（快，持久化没保证）
always：同步持久化，每次发生数据变更时，立即记录到磁盘（慢，安全）
everysec：表示每秒同步一次（默认值,很快，但可能会丢失一秒以内的数据）

推荐（并且也是默认）的措施为每秒 fsync 一次，这种 fsync策略可以兼顾速度和安全性。

4.aof重写机制
（1）原理
AOF 持久化是通过保存被执行的写命令来记录数据库状态的，所以AOF文件的大小随着时间的流逝一定会越来越大；影响包括但不限于：对于Redis服务器，计算机的存储压力；AOF还原出数据库状态的时间增加；

为了解决AOF文件体积膨胀的问题，Redis提供了AOF重写功能：

AOF重写是AOF持久化的一个机制，用来压缩AOF文件，通过fork一个子进程，重新写一个新的AOF文件，该次重写不是读取旧的AOF文件进行复制，而是读取内存中的Redis数据库，重写一份AOF文件，有点类似于RDB的快照方式。

新旧两个文件所保存的数据库状态是相同的，但是新的AOF文件不会包含任何浪费空间的冗余命令，通常体积会较旧AOF文件小很多。

例如AOF文件里可能有太多没用指令，所以AOF会定期根据内存的最新数据生成aof文件例如，执行了如下几条命令：

127.0.0.1:6379> incr readcount
(integer) 1    
127.0.0.1:6379> incr readcount
(integer) 2
127.0.0.1:6379> incr readcount
(integer) 3
127.0.0.1:6379> incr readcount
(integer) 4
127.0.0.1:6379> incr readcount
(integer) 5

重写后AOF文件里变成

*3
$3
SET
$2
readcount
$1
5

AOF重写并不需要对原有AOF文件进行任何的读取，写入，分析等操作，这个功能是通过读取服务器当前的Redis数据库状态来实现的。

# 假设服务器对键list执行了以下命令s;
127.0.0.1:6379> RPUSH list "A" "B"
(integer) 2
127.0.0.1:6379> RPUSH list "C"
(integer) 3
127.0.0.1:6379> RPUSH list "D" "E"
(integer) 5
127.0.0.1:6379> LPOP list
"A"
127.0.0.1:6379> LPOP list
"B"
127.0.0.1:6379> RPUSH list "F" "G"
(integer) 5
127.0.0.1:6379> LRANGE list 0 -1
1) "C"
2) "D"
3) "E"
4) "F"
5) "G"
127.0.0.1:6379>

当前列表键list在数据库中的值就为[“C”, “D”, “E”, “F”, “G”]。要使用尽量少的命令来记录list键的状态，最简单的方式不是去读取和分析现有AOF文件的内容，，而是直接读取list键在数据库中的当前值，然后用一条RPUSH list “C” “D” “E” “F” "G"代替前面的6条命令。

（2）配置
如下两个配置可以控制AOF自动重写频率

# auto‐aof‐rewrite‐min‐size 64mb //aof文件至少要达到64M才会自动重写，文件太小恢复速度本来就很快，重写的意义不大

# auto‐aof‐rewrite‐percentage 100 //aof文件自上一次重写后文件大小增长了100%则再次触发重写

redis 02：Redis的持久化_redis_10

（3）AOF后台重写

Redis不希望AOF重写会造成服务器无法处理请求，所以Redis决定将AOF重写程序放到子进程（后台）里执行。这样处理的最大好处是：
<1> 子进程进行AOF重写期间，主进程可以继续处理命令请求；
<2> 子进程带有主进程的数据副本，使用子进程而不是线程，可以避免在锁的情况下，保证数据的安全性。

（4）问题与解决
<1> 问题：
子进程在进行AOF重写期间，服务器进程还要继续处理命令请求，而新的命令可能对现有的数据进行修改

<2> 解决：

在子进程进行AOF重启期间，Redis主进程执行的命令会被保存在AOF重写缓冲区里面，这个缓冲区在服务器创建子进程之后开始使用，当Redis执行完一个写命令之后，它会同时将这个写命令发送给 AOF缓冲区和AOF重写缓冲区。如下图：

redis 02：Redis的持久化_数据_11

即子进程在执行AOF重写时，主进程需要执行以下三个工作：

执行client发来的命令请求；
将写命令追加到现有的AOF文件中；
将写命令追加到AOF重写缓存中

<3> 阻塞原因
当子进程完成AOF重写工作之后，它会向父进程发送一个信号，父进程在接收到该信号之后，会调用一个信号处理函数，并执行以下工作：

将AOF重写缓冲区中的所有内容写入到新的AOF文件中，保证新 AOF文件保存的数据库状态和服务器当前状态一致。
对新的AOF文件进行改名，原子地覆盖现有AOF文件，完成新旧文件的替换
继续处理客户端请求命令。

在整个AOF后台重写过程中，只有信号处理函数执行时会对 Redis主进程造成阻塞，在其他时候，AOF后台重写都不会阻塞主进程，如下图所示：

redis 02：Redis的持久化_redis_12

整体流程图：

redis 02：Redis的持久化_数据_13

总结

AOF重写的目的是为了解决AOF文件体积膨胀的问题，使用更小的体积来保存数据库状态，整个重写过程基本上不影响Redis主进程处理命令请求；
AOF重写其实是一个有歧义的名字，实际上重写工作是针对数据库的当前状态来进行的，重写过程中不会读写、也不适用原来的AOF文件；
AOF可以由用户手动触发，也可以由服务器自动触发。进入redis客户端执行命令bgrewriteaof重写AOF

RDB 和 AOF ，我应该用哪一个？

redis 02：Redis的持久化_Redis_14

生产环境可以都启用，redis启动时如果既有rdb文件又有aof文件则优先选择aof文件恢复数据，因为aof一般来说数据更全一点。

三、Redis 4.0 混合持久化

4.0版本的混合持久化默认关闭的，通过aof-use-rdb-preamble配置参数控制，yes则表示开启，no表示禁用，5.0之后默认开启。

重启 Redis 时，我们很少使用RDB来恢复内存状态，因为会丢失大量数据。我们通常使用 AOF日志重放，但是重放 AOF 日志性能相对 RDB来说要慢很多，这样在 Redis实例很大的情况下，启动需要花费很长的时间。 Redis 4.0为了解决这个问题，带来了一个新的持久化选项------混合持久化。通过如下配置可以开启混合持久化(必须先开启aof)：

# aof‐use‐rdb‐preamble yes

如果开启了混合持久化，AOF在重写时，不再是单纯将内存数据转换为RESP命令写入AOF文件，而是将重写这一刻之前的内存做RDB快照处理，并且将RDB快照内容和增量的AOF修改内存数据的命令存在一起，都写入新的AOF文件，新的文件一开始不叫appendonly.aof，等到重写完新的AOF文件才会进行改名，覆盖原有的AOF文件，完成新旧两个AOF文件的替换。

于是在 Redis 重启的时候，可以先加载 RDB 的内容，然后再重放增量 AOF
日志就可以完全替代之前的 AOF 全量文件重放，因此重启效率大幅得到提升。

简单的说：通过bgrewriteaof完成的，新的AOF文件前半段是RDB格式的全量数据后半段是AOF格式的增量数据

混合持久化AOF文件结构如下

redis 02：Redis的持久化_数据_15

优点：混合持久化结合了RDB持久化和 AOF 持久化的优点, 由于绝大部分都是RDB格式，加载速度快，同时结合AOF，增量的数据以AOF方式保存了，数据更少的丢失。

缺点：兼容性差，一旦开启了混合持久化，在4.0之前版本都不识别该aof文件，同时由于前部分是RDB格式，阅读性较差

四、redis启动加载持久化

redis 02：Redis的持久化_数据_16

五、小总结：

1.redis提供了rdb持久化方案，为什么还要aof？

优化数据丢失问题，rdb会丢失最后一次快照后的数据，aof丢失不会超过2秒的数据

2.如果aof和rdb同时存在，听谁的？
aof

3.rdb和aof优势劣势
rdb 适合大规模的数据恢复，对数据完整性和一致性不高，在一定间隔时间做一次备份，如果redis意外down机的话，就会丢失最后一次快照后的所有操作；而aof 根据配置项而定

4.官方建议
两种持久化机制同时开启，如果两个同时开启优先使用aof持久化机制

5.Redis数据备份策略：
（1）写crontab定时调度脚本，每小时都copy一份rdb或aof的备份到一个目录中去，仅仅保留最近48小时的备份。
（2）每天都保留一份当日的数据备份到一个目录中去，可以保留最近1个月的备份。
（3）每次copy备份的时候，都把太旧的备份给删了。
（4）每天晚上将当前机器上的备份复制一份到其他机器上，以防机器损坏

六、性能建议（这里只针对单机版redis持久化做性能建议）：

因为RDB文件只用作后备用途，只要15分钟备份一次就够了，只保留save 900 1这条规则。

如果Enalbe AOF，好处是在最恶劣情况下也只会丢失不超过两秒数据，启动脚本较简单只load自己的AOF文件就可以了。
代价一是带来了持续的IO，二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。
只要硬盘许可，应该尽量减少AOF rewrite的频率，AOF重写的基础大小默认值64M太小了，可以设到5G以上。
默认超过原大小100%大小时重写可以改到适当的数值。

标签：02,文件,持久,AOF,Redis,redis,aof,重写
From： https://blog.51cto.com/u_16125162/6330101