首页 > 其他分享 >ClickHouse 数据类型 (三)

ClickHouse 数据类型 (三)

时间:2022-11-09 07:00:09浏览次数:36  
标签:sku 00 05 18 数据类型 2022 102 ClickHouse

6、SummingMergeTree

对于不查询明细,只关心以维度进行汇总聚合结果的场景。如果只使用普通的MergeTree的话,无论是存储空间的开销,还是查询时临时聚合的开销都比较大。ClickHouse 为了这种场景,提供了一种能够“预聚合”的引擎SummingMergeTree 建表
create table t_order_smt(
    id UInt32,
    sku_id String,
    total_amount Decimal(16,2) ,
    create_time  Datetime 
 ) engine =SummingMergeTree(total_amount)
   partition by toYYYYMMDD(create_time)
   primary key (id)
   order by (id,sku_id );
插入数据
insert into  t_order_smt values
(101,'sku_001',1000.00,'2022-05-18 12:00:00'),
(102,'sku_002',2000.00,'2022-05-18 11:00:00'),
(102,'sku_004',2500.00,'2022-05-18 12:00:00'),
(102,'sku_002',2000.00,'2022-05-18 13:00:00'),
(102,'sku_002',12000.00,'2022-05-18 13:00:00'),
(102,'sku_002',600.00,'2022-05-19 12:00:00');
第一次查询
SELECT *
FROM t_order_smt

┌──id─┬─sku_id──┬─total_amount─┬─────────create_time─┐
│ 102 │ sku_002 │       600.00 │ 2022-05-19 12:00:00 │
└─────┴─────────┴──────────────┴─────────────────────┘
┌──id─┬─sku_id──┬─total_amount─┬─────────create_time─┐
│ 101 │ sku_001 │      1000.00 │ 2022-05-18 12:00:00 │
│ 102 │ sku_002 │      2000.00 │ 2022-05-18 11:00:00 │
│ 102 │ sku_002 │      2000.00 │ 2022-05-18 13:00:00 │
│ 102 │ sku_002 │     12000.00 │ 2022-05-18 13:00:00 │
│ 102 │ sku_004 │      2500.00 │ 2022-05-18 12:00:00 │
手工合并再次查询
OPTIMIZE TABLE t_order_smt FINAL

Ok.

0 rows in set. Elapsed: 0.006 sec. 

hadoop201 :) sselect * from t_order_smt;select * from t_order_smt;

SELECT *
FROM t_order_smt

┌──id─┬─sku_id──┬─total_amount─┬─────────create_time─┐
│ 101 │ sku_001 │      1000.00 │ 2022-05-18 12:00:00 │
│ 102 │ sku_002 │     16000.00 │ 2022-05-18 11:00:00 │
│ 102 │ sku_004 │      2500.00 │ 2022-05-18 12:00:00 │
└─────┴─────────┴──────────────┴─────────────────────┘
┌──id─┬─sku_id──┬─total_amount─┬─────────create_time─┐
│ 102 │ sku_002 │       600.00 │ 2022-05-19 12:00:00 │
结论
以SummingMergeTree()中指定的列作为汇总数据列
可以填写多列必须数字列,如果不填,以所有非维度列且为数字列的字段为汇总数据列
以order by 的列为准,作为维度列
其他的列按插入顺序保留第一行
不在一个分区的数据不会被聚合
设计聚合表的话,唯一键值、流水号可以去掉,所有字段全部是维度、度量或者时间戳。问题:能不能直接执行以下SQL得到汇总值
select total_amount from  XXX where province_name=’’ and create_date=’xxx’
不行,可能会包含一些还没来得及聚合的临时明细,如果要是获取汇总值,还是需要使用sum进行聚合,这样效率会有一定的提高,但本身ClickHouse是列式存储的,效率提升有限,不会特别明显。 
select sum(total_amount) from province_name=’’ and create_date=’xxx’

标签:sku,00,05,18,数据类型,2022,102,ClickHouse
From: https://www.cnblogs.com/wdh01/p/16866866.html

相关文章

  • Java数据类型拓展
    Java数据类型拓展publicclassDemo03{  publicstaticvoidmain(String[]args){    //整数拓展:进制 二进制0b 十进制 八进制0 十六进......
  • Java——数据类型转换:自动类型转换&强制类型转换
                             ==================================================================================......
  • ClickHouse集群部署
    集群节点信息192.168.175.212ch01192.168.175.213ch02192.168.175.214ch03搭建一个zookeeper集群复制数据需要zookeeper配合下载安装包zookeeper官网:https://......
  • 【JavaScript 教程】第二章基础知识03—JavaScript 数据类型
    英文 | https://www.javascripttutorial.net/译文|杨小爱在上节中,我们学习了JavaScript的变量,错过的小伙伴可以点击文章《​​【JavaScript教程】第二章基础知识02—Ja......
  • Sqlserver 导出表数据类型和字段详细信息
    USE[DatabaseName]goSETANSI_NULLSON;GOSETQUOTED_IDENTIFIERON;GO--=============================================--Description:<生成数据库......
  • JS基础+变量+数据类型
    js概述====≥使用方式js是什么=====》js是运行在浏览器/客户端上的一种编程语言,实现人机交互。js能做什么===》现在几乎是全能=〉数据交互,表单校验,app的开发,游戏开发,网......
  • Long数据类型序列化Json后传递给前端,产生的精度丢失的问题解决
    问题产生的原因Long类型的数据,如果我们在后端将结果序列化为json,直接传给前端的话,在Long长度大于17位时会出现精度丢失的问题。java中的long能表示的范围比js中number大,......
  • Day04.1数据类型拓展
    Java数据类型拓展篇整数拓展二进制的表示:数值前面加0bintnum1=10;//此值表示十进制的10intnum2=0b10;//此值表示二进制的10八进制的表示:数值前面加0intnum3=......
  • Java——基本数据类型
                    注意: 整型(int)常量默认在内存中占32位,是具有整数类型的值,当运算过程中所需值超过32位长度时,可以把它表示为长整......
  • Day04:Java数据类型
    Java的数据类型强类型语言要求变量的使用要严格符合规定,所有变量都必须先定义后才能使用弱类型语言什么是变量变量:可以变化的量。在Java中每个变量都必须先申明这......