ClickHouse 安装
一、了解ClickHouse
ClickHouse是一个关系型数据库,说到关系型数据库,我们之前也学习到一个数据库Mysql,但是两者之间是有着很大区别的。MySQL数据库一般存储较少的数据(100万以内),而今天学习的ClickHouse存储的数据就相当之大,可以存储亿条数据。再者说两者的工作原理又有着区别,MySQL存储数据是 行式存储(以表格的每一行为单位来存储数据);ClickHouse是列式存储(以表格的每列为单位存储),所以ClickHouse的存储单位比MySQL低一级,所以ClickHouse处理数据的速度与量级都远胜于MySQL。
行式存储与列式存储:
行式存储(Row-Oriented Storage):每次查询时会将表格中的所有列都加载进来,哪怕只需要一列的数据。因此,适用于需要频繁进行写操作或者查询整个记录的场景,如OLTP(在线事务处理)场景。
列式存储(Column-Oriented Storage):每次查询时只加载需要的列,适合进行大规模的分析型查询,例如汇总、聚合操作。因此非常适合 OLAP(在线分析处理)场景。
说到OLTP和OLAP,我们顺便也来了解一下两者
OLTP(在线事务处理)和 OLAP(在线分析处理)是两种截然不同的数据库处理类型
总结:
- OLTP 关注的是快速、频繁的事务处理,强调数据一致性和响应速度,适合处理大量并发用户请求。
- OLAP 关注的是海量数据的复杂查询和分析,适合用于业务决策和大规模数据的趋势分析。
二、ClickHouse的下载
1、去ClickHouse的官网Install ClickHouse | ClickHouse Docs下载,根据自己的设备需要进行下载。
我在centos7上安装,所以选择Production Deployments
最好是进行手动下载安装包
2、解压安装包后上传到虚拟机上进行安装,一共有4个安装包
3、开始安装
1、进入目录:
cd /usr/local/soft/clickhouse-rpm
2、使用rpm命令安装
sudo rpm -ivh *.rpm
注意:安装过程需要输入密码,密码不要复杂,123456即可
3、启动服务
systemctl start clickhouse-server
4、状态查看
systemctl status clickhouse-server
5、停止服务
systemctl stop clickhouse-server
6、重启服务
systemctl restart clickhouse-server
安装输入密码时,密码不会显示
4、远程工具连接
我们要修改一下ClickHouse的配置文件才可以被外部设备访问
修改访问权限
1、打开clickhouse配置文件
vim /etc/clickhouse-server/config.xml
2、搜索并放开下面配置的注释
<listen_host>0.0.0.0</listen_host>
3、保存即可
:wq!
4、重启
systemctl restart clickhouse-server
修改端口号
因为ClickHouse的端口号默认是localhost:9000
这个也是以后我们要学习的Hadoop的端口号,为了以后的方便我们在这里就修改一下ClickHouse的端口号
1、打开clickhouse配置文件
vim /etc/clickhouse-server/config.xml
2、将本机的端口号从9000改为9001
<tcp_port>9000</tcp_port>
<tcp_port>9001</tcp_port>
3、保存即可
:wq!
4、重启
systemctl restart clickhouse-server
到此ClickHouse就安装完毕,就可以在虚拟机中启动客户端
1、输入启动命令
clickhouse-client --port 9001
2、输入密码