首页 > 其他分享 >2.ClickHouse系列之特点介绍

2.ClickHouse系列之特点介绍

时间:2022-10-21 21:35:15浏览次数:92  
标签:存储 系列 列式 写入 介绍 引擎 磁盘 ClickHouse

1. 列式存储

采用列式存储时,数据在磁盘上的组织结构为:
1 2 3 张三 李四 王五 18 20 25
好处:

  • 对于列的聚合、计数、求和等统计操作由于列式存储
  • 由于列数据类型相同,更容易数据压缩
  • 由于数据压缩比更好,不仅节省磁盘空间,更便于cache发挥空间
2. DBMS功能完备

几乎覆盖标准SQL大部分语法,包括DDL与DML,以及配套函数,用户管理权限管理,数据备份与恢复

3. 引擎种类丰富

ClickHouse与Mysql类似,把表级的存储引擎插件化,根据表的不同需求可以设定不同的存储引擎。目前包括合并树、日志、接口和其他四大类20多种引擎

4. 高吞吐写入能力

ClickHouse采用类LSM Tree的结构,数据写入后定期在后台Compaction。ClickHouse在数据导入时全部是顺序append写,写入后数据段不可更改,在后台Compaction时也是多个段merge sort后顺序写回磁盘。顺序写的特性,充分利用了磁盘的吞吐能力。

官方公开能达到50MB200MB写入吞吐能力,按照每行100Byte计算,大约相当于50200W条/s的写入速度

5. 数据分区与线程级并行

ClickHouse将数据划分为多个partition,每个partition在进一步划分为多个index granularity(索引粒度),然后通过多个CPU核心分别处理其中一部分在实现并行处理。因此,单条Query就能利用整机所有CPU

就ClickHouse的特点而言,比较适合处理后的宽表的存储与统计分析

欢迎关注公众号算法小生沈健的技术博客

标签:存储,系列,列式,写入,介绍,引擎,磁盘,ClickHouse
From: https://www.cnblogs.com/shenjian-online/p/16814822.html

相关文章

  • python系列归并排序图文详解
    ​ 算法原理:      改归并排序将序列折半分成两个子序列,然后继续拆分,直到每个序列只有一个数据时,再将各个子序列排序后合并叠加。直到所有子序列都合并,排序完成。......
  • 3.ClickHouse系列之SQL操作
    首先我们建表,表引擎我们后续文章在详细介绍,我们首先了解下基本SQL语法CREATEDATABASEstudy;CREATETABLEstudy.customer(idUInt8,cityString,name......
  • 4.ClickHouse系列之数据类型与表引擎介绍
    上篇文章已经创建过表及熟悉了基本语法,本文介绍CK的数据类型以及表引擎的一些分类与作用1.数据类型类型整型Int8Int16Int32Int64浮点型Float32Flo......
  • vi和vim的基本介绍
    一、Vi和Vim的介绍所有的linux系统都会内建Vi文本编辑器。Vim具有程序编辑的能力,可以看作是Vi的增强版本,可以主动的以字体颜色辨别语法的正确性,方便程序设计二、vi和vim......
  • ClickHouse(二)优化
    ClickHouse优化执行计划    AST(语法树)、SYNTAX(优化后的SQL语句)、PIPELINE(查看PIPELINE计划,可看线程数)建表优化    数据类型优化:1.限定好数据类型  2.......
  • 微服务架构学习与思考(11):开源 API 网关02-以 Java 为基础的 API 网关详细介绍
    微服务架构学习与思考(11):开源API网关02-以Java为基础的API网关详细介绍上一篇关于网关的文章:微服务架构学习与思考(10):微服务网关和开源API网关01-以Nginx为......
  • Linux-history 命令的介绍与使用
    Linux-history命令的介绍与使用介绍在linux下面可以使用history命令查看用户的所有历史操作,同时shell命令操作记录默认保存在用户目录的.bash_history文件中......
  • 微服务系列之分布式日志 ELK
    1.ELK简介ELK是ElasticSearch+LogStash+Kibana的缩写,是现代微服务架构流行的分布式日志解决方案,旨在大规模服务的日志集中管理查看,极大的为微服务开发人员提供了排查......
  • 事务_事务四大特征与事务_事务隔离级别介绍
    事务_事务四大特征事物的四大特征1.原子性:是不可分割的最小操作单位,要么同时成功,要么同时失败2.持久性:当事物提交或回滚后,数据库......
  • 使用Tomcat-5.5.20配置数据库连接池详细介绍
    本文旨在给程序开发人员提供一个比较具体的Tomcat连接池参考方案,为了提高文章的可读性,文章前端引用了一位前辈的话,如果构成误解,请多多谅解,本文不是从商业考虑的。有问题请联......