PXC集群脑裂导致节点是无法加入无主的集群

时间：2022-08-29 21:13:54浏览次数：63

标签：03 28 脑裂集群 2022 PXC 16T11 MY 节点

一套2节点的MySQL PXC集群，第1节点作为主用节点长时间的dml操作，导致大量的事务阻塞，出现异常，此时查看第2节点显示是primary状态，但无事务阻塞情况。
此时第1节点无法正常提供服务，于是以为第2节点可以作为主节点提供sst数据源来新建第1节点，但清空第1节点开始启动时，却发现无法正常启动sst同步，因为：failed to reach primary view
此时的报错信息详情如下：

2022-03-16T11:28:00.546024Z 0 [ERROR] [MY-000000] [Galera] failed to open gcomm backend connection: 110: failed to reach primary view (pc.wait_prim_timeout): 110 (Connection timed out)
         at gcomm/src/pc.cpp:connect():161
2022-03-16T11:28:00.546105Z 0 [ERROR] [MY-000000] [Galera] gcs/src/gcs_core.cpp:gcs_core_open():220: Failed to open backend connection: -110 (Connection timed out)
2022-03-16T11:28:01.546361Z 0 [Note] [MY-000000] [Galera] gcomm: terminating thread
2022-03-16T11:28:01.546471Z 0 [Note] [MY-000000] [Galera] gcomm: joining thread
2022-03-16T11:28:01.546783Z 0 [ERROR] [MY-000000] [Galera] gcs/src/gcs.cpp:gcs_open():1754: Failed to open channel 'pxc-cluster' at 'gcomm://133.95.34.245,133.95.34.246,133.95.34.250': -110 (Connection timed out)
2022-03-16T11:28:01.546831Z 0 [ERROR] [MY-000000] [Galera] gcs connect failed: Connection timed out
2022-03-16T11:28:01.546868Z 0 [ERROR] [MY-000000] [WSREP] Provider/Node (gcomm://133.95.34.245,133.95.34.246,133.95.34.250) failed to establish connection with cluster (reason: 7)
2022-03-16T11:28:01.546903Z 0 [ERROR] [MY-010119] [Server] Aborting

那么比较合理的解释是，异常导致集群发生脑裂，虽然第2节点显示是primary，但无法提供sst同步给其他节点，此时只能将第2节点作为bootstrap服务重启，成为真正的主节点，即可正常启动同步第1节点。
那么此时问题的关键是，第2节点无法提供sst数据同步时的判断依据到底是什么呢？
以上，留作参考。

标签：03,28,脑裂,集群,2022,PXC,16T11,MY,节点
From： https://www.cnblogs.com/likingzi/p/16637364.html

MySQL PXC集群大事务提交超限
研发人员在测试大事务提交时遇见了错误：Goterror5-'Transactionsizeexceedsetthreshold'duringCOMMIT测试了几次都是1200S的时候停止的，不过在注释掉特定步骤后，......
安装elasticsearch集群
https://www.elastic.co/cn/downloads/elasticsearch一、elasticsearch93009200的协议不同：1、9200作为Http协议，主要用于外部通讯。2、9300作为Tcp协议，jar之间就是通过tcp......
集群和分布式部署有什么区别?
1.集群和分布式的区别小饭店原来只有一个厨师，切菜洗菜备料炒菜全干。后来客人多了，厨房一个厨师忙不过来，又请了个厨师，两个厨师都能炒一样的菜，这两个厨师的关系是集群。为了......
MPP集群的搭建
1.端口规划服务器ip实例名PORT_NUMMAL_PORTMAL_DR_PORTGROUP主1192.168.44.171GRP1_MPP_EP01523653375253GRP1备1192.168.44.167GRP1_MPP_EP11......
读写分离集群搭建
1部署规划读写分离集群适合读多写少的应用环境。Ip规划主机名服务ip数据库名实例名DM_1192.168.44.172DMSERVERrw_1DM_2192.168.44.167DMSERVERrw_......
rocketMQ 集群的搭建
准备四台机器先实现2主2从同步修改主配置文件 brokerName//主从要一致brokerId=0//master是0 slave>0brokerRole=SYNC_MAST......
Envoy 集群故障处理机制
故障处理机制Envoy提供了一系列开箱即用的故障处理机制；超时(timeout)有限次数的重试，并支持可变的重试延迟主动健康检查与异常探测连接池断路器所有......
Redis 集群模式
概述Redis在3.0之后开始支持Cluster（集群）模式，特点如下：支持节点的自动发现：可向集群动态添加节点，并自动融入支持slave-master选举和容错：多个master宕机后，选举出......
K8S集群重新初始化
K8S集群重新初始化在引导k8s集群的过程时可能因为这个或那个的原因导致需要重新引导集群，先假定以下的步骤在前面你已经做好了：系统内核设置k8s涉及的镜像已经拉取成功网......
KingbaseES V8R3集群运维案例之---用户自定义表空间管理
案例说明：KingbaseES数据库支持用户自定义表空间的创建，并建议表空间的文件存储路径配置到数据库的data目录之外。本案例复现了，当用户自定义表空间存储路径配置到data下......

PXC集群脑裂导致节点是无法加入无主的集群

相关文章

赞助商

阅读排行