标签：19 diskless redis 2024 Apr repl RDB 磁盘节点

无盘复制的需求背景

redis在启动后自动生成一个唯一的标识符run_id，这个run_id在持久化的时候存在于RDB文件中（如果有启用RDB或者做了RBD备份操作），但是并不存在与AOF文件中（包括混合是持久化文件），如果下次重启从RDB加载数据，那么这个run_id可以保存。如果同时启用了RDB和AOF持久化，redis重启时会优先加载AOF文件，如果从AOF加载，那么这个run_id会重新生成。 redis复制环境下（不管是简单的主从复制，Sentinel，Cluster）主从节点之间依赖run_id做身份标识，当redis重启后，如果不是从RDB中加载的，其身份标识run_id会发生变化，当前实例相当于一个全新的节点，此时会进行一个全量的同步操作（比如从节点重启后，run_id发生了变化，从节点的身份会变为一个“全新的节点”，会向主节点做一次全量同步的请求），以从节点重启后run_id重新生成导致的全量同步步骤大概如下： ----》从节点请求全量同步 --------》主节点生成RDB文件到磁盘（主节点磁盘写操作） ----------》主节点发送RDB文件到从节点（主节点磁盘读操作） ------------》从节点接收主节点发送的RDB文件到本地磁盘（从节点磁盘写操作） --------------》从节点接从本地接收的RDB文件到加载数据到磁盘（从节点磁盘读操作）如果是主节点重启，从AOF中加载持久化的数据，那么会从节点会做类似的全量同步操作可见全量同步过程中，会在主节点上经历一次磁盘写操作和一次磁盘读操作，从节点上经历一次磁盘写操作和磁盘读操作，如果磁盘速度跟不上，可能会拉长全量同步的时长，因此无盘同步的需求就出现了（假设节点间网络没有瓶颈）。

无盘复制过程

一个无盘复制的日志大概如下

从节点的日志

33300:S 06 Apr 2024 19:29:32.276 * Connecting to MASTER ***.***.***.***:***　　　　　　　　　　　　　　#从节点连接至主节点
33300:S 06 Apr 2024 19:29:32.276 * MASTER <-> REPLICA sync started
33300:S 06 Apr 2024 19:29:32.276 * Non blocking connect for SYNC fired the event.
33300:S 06 Apr 2024 19:29:32.276 * Master replied to PING, replication can continue...
33300:S 06 Apr 2024 19:29:32.277 * Partial resynchronization not possible (no cached master)　　　　#从节点重启后，run_id发生变化，作为一个新的从节点，需要做全量同步
33300:S 06 Apr 2024 19:29:37.953 * Full resync from master: f2ec97e11ec65d3e9ecdfd822b93905a9fac37a3:911741
33300:S 06 Apr 2024 19:29:37.958 * MASTER <-> REPLICA sync: receiving streamed RDB from master with EOF to parser #从节点从socket中接收主节点的全量RDB数据
33300:S 06 Apr 2024 19:29:37.958 * MASTER <-> REPLICA sync: Loading DB in memory
33300:S 06 Apr 2024 19:29:37.958 * Loading RDB produced by version 7.0.11
33300:S 06 Apr 2024 19:29:37.958 * RDB age 0 seconds
33300:S 06 Apr 2024 19:29:37.958 * RDB memory usage when created 62.40 Mb
33300:S 06 Apr 2024 19:30:25.667 * Done loading RDB, keys loaded: 191498, keys expired: 0.
33300:S 06 Apr 2024 19:30:25.667 * MASTER <-> REPLICA sync: Swapping active DB with loaded DB　　　　　　
33300:S 06 Apr 2024 19:30:25.667 * MASTER <-> REPLICA sync: Discarding old DB in background　　
33300:S 06 Apr 2024 19:30:25.667 * MASTER <-> REPLICA sync: Finished with success　　#从节点加载全量数据

主节点的日志

32489:M 06 Apr 2024 19:29:32.277 * Replica ***.***.***.***:*** asks for synchronization　　　　#从节点请求主节点做全量复制
32489:M 06 Apr 2024 19:29:32.277 * Full resync requested by replica ***.***.***.***:***
32489:M 06 Apr 2024 19:29:32.277 * Delay next BGSAVE for diskless SYNC　　　　　　　　　　　　　　#主节点由于diskless复制，并没有做bgsave持久化操作
32489:M 06 Apr 2024 19:29:37.952 * Starting BGSAVE for SYNC with target: replicas sockets　　 #主节点以socket网络传送方式传递全量数据
32489:M 06 Apr 2024 19:29:37.954 * Background RDB transfer started by pid 33306
33306:C 06 Apr 2024 19:30:25.186 * Fork CoW for RDB: current 1 MB, peak 1 MB, average 1 MB
32489:M 06 Apr 2024 19:30:25.186 # Diskless rdb transfer, done reading from pipe, 1 replicas still up.
32489:M 06 Apr 2024 19:30:25.276 * Background RDB transfer terminated with success
32489:M 06 Apr 2024 19:30:25.276 * Streamed RDB transfer with replica ***.***.***.***:*** succeeded (socket). Waiting for REPLCONF ACK from slave to enable streaming
32489:M 06 Apr 2024 19:30:25.276 * Synchronization with replica ***.***.***.***:*** succeeded

当从节点以"swapdb"在加载数据的过程中（一遍接收主节点socket数据一边载入当前实例中），当前实例不可访问

对于Redis集群模式，不管是sentinel还是cluster，主从节点的身份都是相对的，都可以在故障发生时做主从切换，因此如果想要实现无盘复制，这几个参数需要再主从节点同时配置。

标签：19,diskless,redis,2024,Apr,repl,RDB,磁盘,节点
From： https://www.cnblogs.com/wy123/p/18124757

redis 无盘复制（redis repl-diskless-sync）

无盘复制的需求背景

相关参数

影响主节点的参数

repl-diskless-sync

repl-diskless-sync-delay

repl-diskless-sync-max-replicas

影响从节点的参数

repl-diskless-load

无盘复制过程

相关文章

赞助商

阅读排行