首页 > 数据库 >[微服务]redis主从集群搭建与优化

[微服务]redis主从集群搭建与优化

时间:2025-01-07 09:29:19浏览次数:3  
标签:slave redis 节点 master sentinel 集群 主从

搭建主从集群

单节点Redis的并发能力是有上限的,要进一步提高Redis的并发能力,就需要搭建主从集群,实现读写分离。

1. 主从集群结构

下图就是一个简单的Redis主从集群结构:

如图所示,集群中有一个master节点、两个slave节点(现在叫replica)。当我们通过Redis的Java客户端访问主从集群时,应该做好路由:

  • 如果是写操作,应该访问master节点,master会自动将数据同步给两个slave节点
  • 如果是读操作,建议访问各个slave节点,从而分担并发压力

2. 搭建主从集群

我们会在同一个虚拟机中利用3个Docker容器来搭建主从集群,容器信息如下:

2.1. 启动多个Redis实例

利用资料提供的docker-compose配置文件来构建主从集群:

a. 文件内容说明:

version: "3.2"

services:
  r1:
    image: redis
    container_name: r1
    network_mode: "host"
    entrypoint: ["redis-server", "--port", "7001"]
  r2:
    image: redis
    container_name: r2
    network_mode: "host"
    entrypoint: ["redis-server", "--port", "7002"]
  r3:
    image: redis
    container_name: r3
    network_mode: "host"
    entrypoint: ["redis-server", "--port", "7003"]
  • redis官网建议在搭建集群时, 使用host网络模式, 让每个容器直接使用宿主机的网络
  • 此网络模式下, 容器会暴露在宿主机, 相当于成为宿主机的一个进程, 所以部署时也不需要端口映射
  • 直接使用宿主机的端口就可以了
  • entrypoint 入口配置, 用于修改容器的启动命令
  • "--port" 参数用于配置容器的默认端口

b. 把镜像文件上传至root目录下, 然后加载镜像文件

c. 在虚拟机的root目录下新建redis目录, 上传配置文件包

d. 执行命令,运行集群

docker compose up -d

执行结果:

查看docker容器,发现都正常启动了:

由于采用的是host模式,我们看不到端口映射。不过能直接在宿主机通过ps命令查看到Redis进程:

2.2. 建立集群

虽然我们启动了3个Redis实例,但是它们并没有形成主从关系。我们需要通过命令来配置主从关系:

# 参数说明
# masterip 主节点IP
# masterport 主节点端口

# 两个命令都能用
# Redis5.0以前
slaveof <masterip> <masterport>
# Redis5.0以后
replicaof <masterip> <masterport>

有临时和永久两种模式:

  • 永久生效:在redis.conf文件中利用slaveof命令指定master节点
  • 临时生效:直接利用redis-cli控制台输入slaveof命令,指定master节点

我们测试临时模式,首先连接r2,让其以r1为master

# 连接r2
docker exec -it r2 redis-cli -p 7002
# 认r1主,也就是7001
slaveof 192.168.150.101 7001
# 退出连接
exit

然后连接r3,让其以r1为master

# 连接r3
docker exec -it r3 redis-cli -p 7003
# 认r1主,也就是7001
slaveof 192.168.150.101 7001

然后连接r1,查看集群状态:

# 连接r1
docker exec -it r1 redis-cli -p 7001
# 查看集群状态
info replication

可以看到,当前节点r1:7001的角色是master,有两个slave与其连接:

  • slave0port7002,也就是r2节点
  • slave1port7003,也就是r3节点

其中重要的信息有:

  • master_replid: 主节点的唯一id
  • offset=672: 偏移量

2.3. 测试

依次在r1r2r3节点上执行下面命令:

set num 123

get num
  • 只有在r1这个节点上可以执行set命令(写操作), 其它两个节点只能执行get命令(读操作)。
  • 也就是说读写操作已经分离了。

主从同步原理

主从同步原理时序图

  1. 当主从第一次同步连接或断开重连时,从节点都会发送psync请求,尝试数据同步
  2. 主节点判断从节点是否第一次连接
  • 每个节点默认都是主节点, 每个主节点都有唯一id属性replicationID, 简称replid
  • 第一次paync, 从节点携带自己的replid
  • 所以, 主节点只需要判断, 从节点的replid是否与自己一致就可以了
  1. 如果是第一次连接, 主节点把自己所有数据全部发送给子节点
  • replid不一致, 属于第一次同步, 进行全量同步
  • 主节点将完整内存数据生成RDB,发送到从节点
  • 从节点清空本地数据, 加载RDBD到内存
  • 从节点把自己的replid 改成 主节点的replid
  1. 如果是重新连接, 主节点把子节点缺少的数据发给子节点
  • 全量同步需要先做RDB,然后将RDB文件通过网络传输个slave,成本太高了
  • 大多数时候从节点与主节点都是做增量同步
  • 增量同步就是只更新主从节点存在差异的数据。
  • 主节点会维护repl backlog文件, 其中会记录Redis处理过的命令及offset,包括主节点当前的offset,和子节点已经拷贝到的offset
  • 只要主从的offset一致, 代表数据一致, 如果offset存在差异, 那差异的部分,就是子节点需要增量拷贝的数据
  • repl_baklog大小有上限,写满后会覆盖最早的数据。如果slave断开时间过久,导致尚未备份的数据被覆盖,则无法基于repl_baklog做增量同步,只能再次全量同步。
  1. 每次主节点写数据时, 都把命令传播给子节点, 保持数据实时同步

主从集群优化

可以从以下几个方面来优化Redis主从集群:

  1. 在master中配置repl-diskless-syncyes启用无磁盘复制,避免全量同步时的磁盘IO。
  2. Redis单节点上的内存占用不要太大,减少RDB导致的过多磁盘IO, 一般建议不超过8G
  3. 适当提高repl_baklog的大小,发现slave宕机时尽快实现故障恢复,尽可能避免全量同步
  4. 限制master上的slave节点数量,如果实在是太多slave,则可以采用主-从-从链式结构,减少master压力

哨兵原理

Redis提供了哨兵(Sentinel)机制来实现主从集群的自动故障恢复。哨兵的具体作用如下:

  1. 监控: Sentinel会不断检查您的master和slave是否按预期工作
  2. 自动故障切换: 如果master故障,Sentinel会将-个slave提升为master。当故障实例恢复后也以新的master为主
  3. 通知: 当集群发生故障转移时,Sentinel会将最新节点角色信息推送给Redis的客户端

服务状态监控

Sentinel基于心跳机制监测服务状态,每隔1秒向集群的每个实例发送ping命令:

  1. 主观下线: 如果某sentinel节点发现某实例未在规定时间响应,则认为该实例主观下线。
  2. 客观下线: 若超过指定数量(quorum)的sentinel都认为该实例主观下线,则该实例客观下线。
  3. quorum值最好超过Sentinel实例数量的一半

选举新的master

一旦发现master故障,sentinel需要在salve中选择一个作为新的master,选择依据是这样的:

  1. 首先会判断slave节点与master节点断开时间长短, 如果超过指定值 (down-after-milliseconds*10) 则会排除该slave节点
  2. 然后判断slave节点的slave-priority值,越小优先级越高,如果是0则永不参与选举, 默认都是1
  3. 如果slave-prority一样,则判断slave节点的offset值, 越大说明数据越新,优先级越高
  4. 最后是判断slave节点的运行id大小,越小优先级越高

如何实现故障转移

当选中了其中一个slave为新的master后(例如slave1),故障的转移的步骤如下:

  1. sentinel给备选的slave1节点发送 slaveof no one 命令,让该节点成为master
  2. sentinel给所有其它slave发送 slaveof 192.168.150.101 7002 命令,让这些slave成为新master的从节点,开始从新的master上同步数据。
  3. 最后,sentinel将故障节点标记为slave,当故障节点恢复后会自动成为新的master的slave节点

搭建哨兵集群

首先, 停掉之前的redis集群:

# 老版本DockerCompose
docker-compose down

# 新版本Docker
docker compose down

然后,我们找到课前资料提供的sentinel.conf文件:

其内容如下:

sentinel announce-ip "192.168.150.101"
sentinel monitor hmaster 192.168.150.101 7001 2
sentinel down-after-milliseconds hmaster 5000
sentinel failover-timeout hmaster 60000

说明:

  • sentinel announce-ip "192.168.150.101":声明当前sentinel的ip
  • sentinel monitor hmaster 192.168.150.101 7001 2:指定集群的主节点信息
    • hmaster:主节点名称,自定义,任意写
    • 192.168.150.101 7001:主节点的ip和端口
    • 2:认定master下线时的quorum
  • sentinel down-after-milliseconds hmaster 5000:声明master节点超时多久后被标记下线
  • sentinel failover-timeout hmaster 60000:在第一次故障转移失败后多久再次重试
  • 把配置文件中的信息修改为自己虚拟机的地址

我们在虚拟机的/root/redis目录下新建3个文件夹:s1s2s3:

  1. 将课前资料提供的sentinel.conf文件上传到s1文件夹中, 再拷贝到其他文件夹中。

  1. 接着修改docker-compose.yaml文件, 注意ip地址,内容如下:
version: "3.2"

services:
  r1:
    image: redis
    container_name: r1
    network_mode: "host"
    entrypoint: ["redis-server", "--port", "7001"]
  r2:
    image: redis
    container_name: r2
    network_mode: "host"
    entrypoint: ["redis-server", "--port", "7002", "--slaveof", "192.168.150.101", "7001"]
  r3:
    image: redis
    container_name: r3
    network_mode: "host"
    entrypoint: ["redis-server", "--port", "7003", "--slaveof", "192.168.150.101", "7001"]
  s1:
    image: redis
    container_name: s1
    volumes:
      - /root/redis/s1:/etc/redis
    network_mode: "host"
    entrypoint: ["redis-sentinel", "/etc/redis/sentinel.conf", "--port", "27001"]
  s2:
    image: redis
    container_name: s2
    volumes:
      - /root/redis/s2:/etc/redis
    network_mode: "host"
    entrypoint: ["redis-sentinel", "/etc/redis/sentinel.conf", "--port", "27002"]
  s3:
    image: redis
    container_name: s3
    volumes:
      - /root/redis/s3:/etc/redis
    network_mode: "host"
    entrypoint: ["redis-sentinel", "/etc/redis/sentinel.conf", "--port", "27003"]
  1. 直接运行命令,启动集群:
docker-compose up -d
  1. 运行结果:

我们以s1节点为例,查看其运行日志:

可以看到sentinel已经联系到了7001这个节点,并且与其它几个哨兵也建立了链接。哨兵信息如下:

  • 27001Sentinel ID8e91bd24ea8e5eb2aee38f1cf796dcb26bb88acf
  • 27002Sentinel ID5bafeb97fc16a82b431c339f67b015a51dad5e4f
  • 27003Sentinel ID56546568a2f7977da36abd3d2d7324c6c3f06b8d

演示failover

接下来,我们演示一下当主节点故障时,哨兵是如何完成集群故障恢复(failover)的。

我们连接7001这个master节点,然后通过命令让其休眠60秒,模拟宕机:

# 连接7001这个master节点,通过sleep模拟服务宕机,60秒后自动恢复
docker exec -it r1 redis-cli -p 7001 DEBUG sleep 60

稍微等待一段时间后,会发现sentinel节点触发了failover

RedisTemplate连接哨兵集群

分为三步:

  • 1)引入依赖
  • 2)配置哨兵地址
  • 3)配置读写分离

1.引入依赖

就是SpringDataRedis的依赖:

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>

2.配置哨兵地址

连接哨兵集群与传统单点模式不同,不再需要设置每一个redis的地址,而是直接指定哨兵地址:

spring:
  redis:
    sentinel:
      master: hmaster # 集群名
      nodes: # 哨兵地址列表
        - 192.168.150.101:27001
        - 192.168.150.101:27002
        - 192.168.150.101:27003

3.配置读写分离

最后,还要配置读写分离,让java客户端将写请求发送到master节点,读请求发送到slave节点。定义一个bean即可:

@Bean
public LettuceClientConfigurationBuilderCustomizer clientConfigurationBuilderCustomizer(){
    return clientConfigurationBuilder -> clientConfigurationBuilder.readFrom(ReadFrom.REPLICA_PREFERRED);
}

这个bean中配置的就是读写策略,包括四种:

  • MASTER:从主节点读取
  • MASTER_PREFERRED:优先从master节点读取,master不可用才读取slave
  • REPLICA:从slave节点读取
  • REPLICA_PREFERRED:优先从slave节点读取,所有的slave都不可用才读取master

标签:slave,redis,节点,master,sentinel,集群,主从
From: https://blog.csdn.net/CSDN20221005/article/details/144956204

相关文章

  • Redis使用方法
    Redis是一个基于内存的key-value结构数据库,即非关系型数据库,具有高性能、丰富的数据类型、持久化、高可用性和分布式等特点。1:首先可以通过本地下载或服务器下载对应的Redis资源包win本地下载资源包:......
  • Redis可视化工具 Another Redis Desktop Manager工具使用详细教程(附下载链接)
    Redis可视化工具推荐:AnotherRedisDesktopManagerRedis是一种高性能的键值数据库,广泛应用于缓存和消息队列等场景。对于开发者来说,命令行工具固然强大,但操作繁琐。而一款高效易用的可视化工具可以极大地提升使用效率。本篇将为大家推荐一款开源、跨平台且功能强大的Redis可......
  • redis和数据库和消息队列
    NoSQL非关系型的数据库,键值、文档以及图形类型数据存储。天生支持分布式,数据冗余和数据分片等特性,提供可扩展的高可用高性能数据存储。redisRedis优缺点:读写快因为在内存中,只适合小数据量存储和读写因为在内存比磁盘小。Redis单线程很快的原因1、redis是纯内存操作2、采用......
  • 使用 NodeLocalDNS 提升集群 DNS 性能和可靠性
    本文主要分享如何使用NodeLocalDNSCache来提升集群中的DNS性能以及可靠性,包括部署、使用配置以及原理分析,最终通过压测表明使用后带来了高达50%的性能提升。1.背景什么是NodeLocalDNSNodeLocalDNSCache是一套DNS本地缓存解决方案。NodeLocalDNSCache通过在集群......
  • Redis中的Red Lock/Redis锁
    1.2RedLock注意红锁的服务器是只存锁信息的和存业务信息的redis服务器是分开的步骤:首先集群部署Redis,官方推荐至少5个实例,不需要主从和哨兵,每个服务器是独立的,不存在信息同步。五个服务器不需要任何交互。客户端对五个实例依次申请锁,如果最终申请成功的数量超过半数(>=......
  • 零基础手把手教您在笔记本电脑上部署kubernetes 1.31.3 集群
    我是知识的实践者,关注我,手把手教您部署实践。贵在真实,主打就是一个按步骤做下去不会出错。一、Kubernetes概述一句话,他很强大,你必须要学会,否则就跟不上技术的潮流了。本人资源有限,在笔记本电脑上16G内存部署k8s集群,让大家都能接触到新技术NAMESTATUSROLES......
  • openEuler欧拉部署Redis.240108
    一、系统优化关闭防火墙systemctlstopfirewalldsystemctldisablefirewalld关闭selinuxsed-ri's/SELINUX=enforcing/SELINUX=disabled/'/etc/selinux/configsetenforce0​二、安装Redisdnf-yinstallredisvim/etc/redis.conf#bind127.0.0.1bind0.0.0.0pr......
  • Redis发布订阅模式
    什么是发布订阅?Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。Redis的subscribe命令可以让客户端订阅任意数量的频道,每当有新信息发送到被订阅的频道时,信息就会被发送给所有订阅指定频道的客户端。☛下图展示了频道channel1,以及......
  • 在C程序中实现类似Redis的SCAN机制的LevelDB大规模key分批扫描
    在C程序中实现类似Redis的SCAN机制的LevelDB大规模key分批扫描,需要充分利用LevelDB的迭代器(iterator)功能,以便能够高效地扫描和处理大量的键值对。下面是一个详细的实现指南。环境准备首先,确保已经安装了LevelDB和相关的开发库。可以使用以下命令安装LevelDB:sudoapt-getinstal......
  • window环境运行 django+celery+redis 异步任务报错:kombu.exceptions.OperationalError
    在所有配置都正常,并且redis服务正常,django和celery服务启动都正常;但就在请求执行异步任务时报错了:kombu.exceptions.OperationalError:[WinError10061]由于目标计算机积极拒绝,无法连接。启动服务指令:django:pythonmanage.pyrunservercelery:celery-Adifyworker-l......