详解 ClickHouse 的副本机制

时间：2024-06-22 11:00:58浏览次数：24

标签：xml sku 00 副本 order 详解 ClickHouse id clickhouse

一、简介

副本功能只支持 MergeTree Family 的表引擎，参考文档：https://clickhouse.tech/docs/en/engines/table-engines/mergetree-family/replication/

ClickHouse 副本的目的主要是保障数据的高可用性，即使一台 ClickHouse 节点宕机，那么也可以从其他服务器获得相同的数据。

二、原理

主要依赖 Zookeeper 来进行多个 ClickHouse 节点间数据的同步，各节点间没有主从关系

在这里插入图片描述

三、配置

以 3 台虚拟机节点集群为例

在集群的一台节点 hadoop102 上修改配置文件

#1. 使用外部文件进行配置
su root
cd /etc/clickhouse-server/config.d
vim metrika.xml

#添加zookeeper信息
<?xml version="1.0"?>
<yandex>
    <zookeeper-servers>
        <node index="1">
            <host>hadoop102</host>
            <port>2181</port>
        </node>
        <node index="2">
            <host>hadoop103</host>
            <port>2181</port>
        </node>
        <node index="3">
            <host>hadoop104</host>
            <port>2181</port>
        </node>
    </zookeeper-servers>
</yandex>

#修改metrika.xml文件的所属用户及组
chown clickhouse:clickhouse metrika.xml

cd /etc/clickhouse-server
vim config.xml

#查找zookeeper位置，添加配置
<zookeeper incl="zookeeper-servers" optional="true" />
<include_from>/etc/clickhouse-server/config.d/metrika.xml</include_from>


#2. 直接在 config.xml 中进行配置
su root
cd /etc/clickhouse-server
vim config.xml

#查找zookeeper位置，去掉<zookeeper></zookeeper>的注释并修改
<zookeeper>
    <node>
        <host>hadoop102</host>
        <port>2181</port>
    </node>
    <node>
        <host>hadoop103</host>
        <port>2181</port>
    </node>
    <node>
        <host>hadoop104</host>
        <port>2181</port>
    </node>
</zookeeper>

同步配置文件到其他节点

/etc/clickhouse-server/config.d/metrika.xml
/etc/clickhouse-server/config.xml

启动 zookeeper 集群服务
分别在 clickhouse 对应的节点启动服务
```
sudo clickhouse start
```

四、使用

在集群一台节点 hadoop102 上进入 clickhouse 客户端并创建表

create table t_order_rep2 
(
	id UInt32,
	sku_id String,
	total_amount Decimal(16,2),
	create_time Datetime
) 
engine=ReplicatedMergeTree('/clickhouse/table/01/t_order_rep','rep_102')
partition by toYYYYMMDD(create_time)
primary key (id)
order by (id,sku_id);

--ReplicatedMergeTree中的参数说明：
--1. '/clickhouse/table/01/t_order_rep'：指定表的分片在 zookeeper 中的地址，一般按照 /clickhouse/table/{shard}/{table_name} 的格式，只有一个分片就写 01

--2. 'rep_102'：指定副本名称，相同的分片副本名称不能相同

在集群另一台节点 hadoop103 上进入 clickhouse 客户端并创建表

create table t_order_rep2 
(
	id UInt32,
	sku_id String,
	total_amount Decimal(16,2),
	create_time Datetime
) 
engine=ReplicatedMergeTree('/clickhouse/table/01/t_order_rep','rep_103')
partition by toYYYYMMDD(create_time)
primary key (id)
order by (id,sku_id);

在 hadoop102 上向表中插入数据

insert into t_order_rep2 values
(101,'sku_001',1000.00,'2020-06-01 12:00:00'),
(102,'sku_002',2000.00,'2020-06-01 12:00:00'),
(103,'sku_004',2500.00,'2020-06-01 12:00:00'),
(104,'sku_002',2000.00,'2020-06-01 12:00:00'),
(105,'sku_003',600.00,'2020-06-02 12:00:00');

在 hadoop103 上查询表中数据，能正确返回则表示副本配置成功
```
select * from t_order_rep2;
```

标签：xml,sku,00,副本,order,详解,ClickHouse,id,clickhouse
From： https://blog.csdn.net/weixin_44480009/article/details/139878870

C语言中操作符详解（一）
众所周知，在我们的C语言中有着各式各样的操作符，并且在此之前呢，我们已经认识并运用了许许多多的操作符，都是诸君的老朋友了昂操作符作为我们使用C语言的一个非常非常非常重要的工具，诸君一定要加以重视，认真理解，学会灵活运用。那么今天，我们就来系统的讲解一下C语言中的各式操作符......
详解mysql安装、常见问题及解决方法
一、MySQL简介MySQL是一个广泛使用的开源关系型数据库管理系统(RDBMS)，由瑞典公司MySQLAB开发，后被SunMicrosystems收购，最终归属Oracle公司所有。它以其快速、可靠、可扩展的特性而闻名，并且因其开源的性质在各类应用中得到了广泛应用。以下是MySQL的详细简介：主......
Java中的构造器详解
在Java中，构造器（也称构造方法）是一种特殊的方法，用于初始化对象的状态。当创建对象时，构造器会被自动调用。以下是关于Java中构造器的详细解释：命名规则：构造器的名称必须与类名完全相同。构造器没有返回值类型，连void也没有。用途：初始化对象的属性（实例变量）。执行一些必要的操作，......
LOMBOK使用详解
最近正在写SpringBoot系列文章和录制视频教程，每次都要重复写一些Getter/Setter、构造器方法、字符串输出的ToString方法和Equals/HashCode方法等。甚是浪费时间，也影响代码的可读性。因此，今天就给大家推荐一款Java开发神器——Lombok，让代码更简单易读。什么是LombokLombok是一款J......
Spring Bean 生命周期详解
SpringBean生命周期详解在Spring框架中，Bean的生命周期由Spring容器全权管理。了解和掌握Bean的生命周期对于使用Spring开发稳定且高效的应用程序至关重要。本文将详细介绍SpringBean生命周期的五个主要阶段：实例化、属性注入、初始化、使用和销毁，并涵盖各个阶......
优先级队列(堆)的知识点详解
目录1.优先级队列1.1概念2.优先级队列的模拟实现2.1堆的概念2.2堆的存储方式2.3堆的创建2.3.1堆向下调整2.4堆的插入与删除2.4.1堆的插入2.4.2堆的删除3.常用接口介绍3.1PriorityQueue的特性3.2PriorityQueue常用接口介绍1.优先级队列1.1概念前......
面试题(TCP/IP协议)详解三次握手
TCP/IP协议中的三次握手我们首先来了解一下TCPTCP(TransmissionControlProtocol，传输控制协议)是一个面向连接的、可靠的、基于字节流的传输层通信协议。以下是TCP的一些主要特点：面向连接：在数据传输之前，TCP必须先建立连接（三次握手），在数据传输结束后，还要终止这个连接（......
【数据结构与算法刷题系列】判断链表是否有环（图文详解）
......
Java变量技术详解
在Java编程中，变量是存储数据的基本单元，理解变量的概念、类型和使用方法是编写高效代码的基础。本文将详细介绍Java中的变量，包括变量的定义、类型、作用域和常见用法，并通过代码示例来帮助理解这些概念。一、变量的定义和声明在Java中，变量的定义和声明遵循以下格式：typevar......
数据结构——队列(Queue)详解
1.队列（Queue）1.1概念队列：只允许在一端进行插入数据操作，在另一端进行删除数据操作的特殊线性表，队列具有先进先出FIFO(FirstInFirstOut)的性质入队列：进行插入操作的一端称为队尾(Tail/Rear)出队列：进行删除操作的一端称为队头(Head/Front)2队列的使用在Java中，Queue是个接......

详解 ClickHouse 的副本机制

一、简介

二、原理

三、配置

四、使用

相关文章

赞助商

阅读排行