HIVE - HIVEQL学习笔记

时间：2023-02-16 19:22:49浏览次数：60

标签：PARTITION JOIN name HIVEQL DROP 笔记 HIVE TABLE ALTER

Hive Learning

HIVEQL和MYSQL最为接近

数据操作

SHOW TABLES IN crm_integration

Show tables 'dim_con*'

DESCRIBE EXTENDED crm_integration.itg_fact_sales_order

DESCRIBE FORMATTED crm_integration.itg_fact_sales_order

show partitions crm_integration.itg_fact_sales_order --查看表中所有分区

DELETE TABLE

DROP TABLE IF EXSTS employees

.Trash(需要开启回收站功能)

ALTER TABLE log_MESSAGES RENAME TO logmsgs;

ALTER TABLE table ADD PARTITION…

ALTER TABLE logmessages DROP IF EXISTS PARTITION (year = 2011, month =12, _day =2 )

ALTER TABLE log ADD COLUMNS(app_name STRING COMMENT ‘application name’)

替换列：REPLACE

ARCHIVE PARTITION

保护：

ALTER TABLE logmessages DROP IF EXISTS PARTITION (year = 2011, month =12, day =2 ) ENABLE NO_DROP

ALTER TABLE logmessages DROP IF EXISTS PARTITION (year = 2011, month =12, day =2 ) ENABLE OFFLINE

装载数据

Load data local

Overwrite

集合数据类型中的元素提取：

SELECT name, subordinates[0] FROM employees;

SELECT name, deductions[“State Taxes”] FROM EMPLOYEES;

这里deductions列是一个map，jason格式。

引用struct中的元素，可以用点。

SELEFCT name, ADDRESS.CITY FROM EMPLOYEES;

正则表达式：

LIKE, RLIKE

LIMIT 2

谓词：

A<> B

A !=B

A is null

A IS NOT NULL

A LIKE B

A NOT LIKE B

A RLIKE B

A REGEXP B

JOIN（笛卡尔积） --消耗资源，不建议

LEFT OUTER JOIN

LEFT SEMI-JOIN:

返回左边表的记录，前提是记录对于右边表满足ON语句中的判定条件。Sql回通过IN…EXISTS结构来处理这种情况。

HIVE不支持RIGHT SEMI-JOIN

SEMI-JOIN比inner join要更高效。

SORT BY –每个reducer中对数据排序，局部排序过程

ORDER BY—全局有序

DISTRIBUTE BY –写在SORT BY 前面。

CLUSTER BY

数据类型：

CAST(SALARY AS FLOAT)

6.9 抽样查询：

RAND()

数据块抽样：

SELECT * FROM numbersflat TABLESAMPLE (0.1 PERCENT) s;

CREATE TABLE shipments2 LIKE shipment

索引：

Show FORMATTED INDEX ON employess

调优

EXPLAIN

EXPLAIN SELECT SUM(NUMBER) FROM onecol;

EXPLAIN EXTENDED

标签：PARTITION,JOIN,name,HIVEQL,DROP,笔记,HIVE,TABLE,ALTER
From： https://www.cnblogs.com/watermarks/p/17127997.html

PLC入门笔记11
1.开关？输入拨杆开关、点动开关、常开、常闭开关霍尔接近开关（磁场N极导通3线+-DC24V）、电容接近开关（非金属）、电感接近开关（金属）2.输入接线？NPN型，不需要外接电源，直接短......
普通生成函数学习笔记
现在我们考虑有一个序列\((a_1,a_2,a_3,\cdots,a_n,\cdots)\)。我们将这个序列作为形式幂级数\(A(x)=\sum_{n\ge0}{a_{n}x^n}\)的常数项序列。\(A(x)\)就是序列\(\{a......
多项式全家桶笔记整理（完善中）
Part0泰勒展开的推广&多项式牛顿迭代§0.1记号和约定为了不在下文引起混淆，这里简述一下这篇文章使用的记号：\(f(x)\)或者\(F(x)\)：一个形式幂级数，此处的\(x\)是......
nuxt3 项目创建笔记
一.npxnuxiinitnuxt3-club创建项目的时候会报错： ERRORFailedtodownloadtemplatefromregistry:requesttohttps://raw.githubusercontent.com/nuxt/start......
【IMX6ULL学习笔记】三、U-BOOT Makefile详解
00、通识版本号VERSION=2016//主版本号PATCHLEVEL=03 //补丁版本号SUBLEVEL= //次版本号EXTRAVERSION=//附加版本信息NAME= //名字有关的，一般......
统计学——复习笔记
目录算数平均数计算加权算术平均数调和平均数（倒数平均数）加权调和平均数几何平均数在组距数列中确定中位数在组距数组中确定众数在组距数组中确定四分位数极差（全距）四分位差（......
[笔记] 循环神经网络（RNN）的原理、特点、拓展
【笔记传送门】深度学习 ......
【pytorch函数笔记（二）】torch.nn.Sigmoid()
importtorch.nnasnntorch.nn.Sigmoid()一、sigmoid介绍 sigmoid是激活函数的一种，它会将样本值映射到0到1之间。 sigmoid的公式如下：\[\large\frac{1}{1+e^{......
[笔记] 卷积神经网络的原理、特点、拓展
【笔记传送门】深度学习 ......
Hive 刷题——员工在职人数问题
需求描述现有用户表（emp）如下。id(员工id)en_dt(入职日期)le_dt(离职日期)10012020-01-02null10022020-01-022020-03-0510032020-02-022020-02-15100......

HIVE - HIVEQL学习笔记

数据操作

谓词：

数据类型：

6.9 抽样查询：

索引：

调优

相关文章

赞助商

阅读排行