1、为啥需要持久化?
因为Redis服务是使用内存存储的,一旦Redis Server停止工作或者服务重启等问题,Redis Server使用的内存将被清空,数据也就丢失了。所以持久化是保证数据备份的关键。
2、Redis持久化有哪些方式?
Redis提供了两种持久化方式——RDB(快照持久化方式)和AOF(日志型的实时持久化方式)。
3、什么是RDB?
Redis的RDB持久化方式是将某个时间点上Redis中的数据以快照的形式保存在硬盘上。可以将快照看作是Redis中的一张静态的图片,图片中记录了快照时刻Redis中的所有数据。
3.1、RDB实现原理
RDB是Redis的快照持久化方式。当Redis需要进行快照操作时,它会fork出一个子进程,负责将快照写入磁盘,而父进程则继续处理请求。由于Redis使用了写时复制(COW)的技术,所以子进程只需要复制到父进程中发生过改变的数据页,而不是复制整个Redis进程的内存空间。因此,这个过程不会对父进程的性能造成较大的影响。
3.2、RDB的优点
RDB持久化方式对于大规模数据的备份非常高效,因为它只需要在一定时间间隔内将Redis当前的数据生成一个快照,就可以将这个快照存档到磁盘中。而且,快照文件通常比AOF文件更小,这意味着它们的恢复速度会更快。
它还可以在处理大量数据的情况下节省CPU资源,并且可以非常准确地回滚数据到某个特定的时间点。因为只有一个文件需要处理,因此维护每个版本的数据非常简单,以及在维护Redis集群时,各节点上的RDB文件可以按照需要进行传输和重备份。
3.3、RDB的缺点
RDB持久化方式不太适合用作实时数据备份的解决方案,就算在数据较快的交易场景也无法做到实时备份。因为在发生意外宕机时,最近一次快照备份的数据就会被丢失。
4、什么是AOF
Redis的AOF持久化方式是一种日志型的实时持久化方式。在Redis使用AOF方式时,每当Redis执行了一条修改数据的指令时,它就会将这条指令以命令的形式写入到一个AOF文件中,当Redis需要恢复数据时,会执行AOF文件中所有的指令。
4.1、AOF实现原理
AOF是Redis服务器的一个追加文件,Redis对执行的每个写命令在这个文件的结尾添加一条日志记录。而当Redis需要在服务器启动时或者重启时重建数据集时,将会按照写命令在文件中的顺序将日志文件中的命令重新执行一遍。
4.2、AOF的优点
AOF持久化方式会记录所有的修改操作,并且在Redis各项命令执行完毕后才会写入AOF文件,并没有延时。由于这个原因,即使在发生意外宕机时,最后一条日志条目也不会丢失。这种持久化方式足以极大程度上减少数据丢失的风险。
此外,AOF持久化方式还可以在增量模式下运行,这个模式下,Redis只会在master节点上执行。它只包含对现有数据的修改,而RDB在执行快照操作时,需要将整个Redis的内存全部写入到磁盘,因此AOF的处理速度通常比RDB快。
4.3、AOF的缺点
相比RDB方式,AOF方式虽然在进行数据备份时更加实时和精确,但是也因为历史执行过的所有指令都必须保存,会导致文件变得更加庞大和臃肿。因此,AOF恢复速度较RDB慢,且文件需要定期进行重写,否则文件大小会无限制增长。
5、两种持久化方式的选择
通过对比两种持久化方式的优缺点,我们可以发现,在实际的应用环境中使用哪种持久化方式,应根据实际场景来决定。比如,对于对所有数据备份都十分在意的应用场合,我们可以使用AOF持久化方式来避免数据的丢失,因为它可以在实时记录所有修改指令的情况下,保证了数据的完整性。而在快速备份和数据恢复速度重要的场合,推荐使用RDB持久化方式。因为RDB生成的快照文件较小,恢复速度快,在处理大规模数据的情况下,可以大大减少CPU的负担。
以最常用的互联网行业为例:对于互联网行业中的用户行为数据,因为需要实时访问和修正,建议使用AOF方式进行持久化,由于持久化过程中具有一定的延时,因此在快照备份的情况下,应该适量减少备份周期;对于系统配置数据,由于配置数据相对比较小,使用RDB持久化方式更为合适。
6、总结
在实际应用中,RDB与AOF方式可以作为完全不同的两种备份方案,依据各自优缺点与传输数据的需求进行选择。虽然对于绝大部分的Redis应用,在容错方面还是有RDB和AOF两种方式同时启动才能实现全面的保护,但是掌握这两种方式的差异性和适用范围,有助于更好地理解Redis数据的传输。
最后,总结一下:
-
RDB与AOF并无取代关系,可以同时启用来实现全方位数据备份;
-
RDB生成的快照文件较小,恢复速度快,在处理大规模数据的情况下,不会对CPU造成大的影响;
-
AOF通过实时记录所有修改指令,保证数据的完整性,但是会导致文件变得更加庞大和臃肿,需要定期进行重写。
-
实际应用中应根据具体场景选择合适的数据备份方式。