Hive基本操作

时间：2023-12-30 18:11:08浏览次数：36

标签：hdfs CREATE Hive emp 基本操作 deptno txt data

Hive的基本操作很简单，与SQL的写法很类似，总结如下：

进入Hive环境

$HIVE_HOME/bin/hive

数据库操作

CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES 　　 (property_name=property_value, ...)];

CREATE DATABASE IF NOT EXISTS hive;

CREATE DATABASE IF NOT EXISTS hive2 LOCATION '/test/location';

CREATE DATABASE IF NOT EXISTS hive3 WITH DBPROPERTIES('creator'='pk');

/user/hive/warehouse是Hive默认的存储在HDFS上的路径

表操作

CREATE TABLE emp(

empno int, ename string,

job string, mgr int, hiredate string,

sal double, comm double, deptno int )

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

加载数据到emp表

追加Linux本地文件里的数据到emp表

load data local inpath '/home/hadoop/data/emp.txt' into table emp;

overwrite覆盖操作，使用Linux本地文件里的数据覆盖掉原来emp表的数据

　　load data local inpath '/home/hadoop/data/emp.txt' overwrite into table emp;

将hdfs上某文件里的数据追加到emp表（此操作完毕后，hdfs上的该文件就自动删除）

　　load data inpath 'hdfs://hadoop000:8020/data/emp.txt' into table emp;

overwrite覆盖操作，使用hdfs上某文件里的数据覆盖掉emp表的数据（此操作完毕后，hdfs上的该文件就自动删除）

load data inpath 'hdfs://hadoop000:8020/data/emp.txt' overwrite into table emp;

聚合： max/min/sum/avg

分组函数： group by 求每个部门的平均工资

select deptno, avg(sal) from emp group by deptno;

join ：多表连接（emp表与dept表连接）

CREATE TABLE dept( deptno int, dname string, loc string ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

LOAD DATA LOCAL INPATH '/home/hadoop/data/dept.txt' OVERWRITE INTO TABLE dept;

select e.empno,e.ename,e.sal,e.deptno,d.dname from emp e join dept d on e.deptno=d.deptno;

标签：hdfs,CREATE,Hive,emp,基本操作,deptno,txt,data
From： https://www.cnblogs.com/tianpan666/p/17936617.html

【数据结构】C语言实现双链表的基本操作
双链表导言大家好，很高兴又和大家见面啦！！！经过前面几个篇章的内容分享，相信大家对顺序表和单链表的基本操作都已经熟练掌握了。今天咱们将继续分享线性表的链式存储的第二种形式——双链表。在今天的内容中，咱们将介绍双链表的创建以及一些基本操作，接下来跟我一起来看看吧！一、单链表与双......
华为云耀云服务器L实例-大数据学习-Hive的部署-1
华为云耀云服务器L实例-大数据学习-Hive的部署-1 产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，介绍Hive的部署 Hive 是建立在 Hado......
华为云耀云服务器L实例--Hive的部署
华为云耀云服务器L实例--Hive的部署产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，继续Hive的部署 Hive 是建立在 Hadoop 上的一个......
【数据结构】C语言实现单链表的基本操作
单链表基本操作的实现导言大家好，很高兴又和大家见面啦！！！在上一篇中，我们详细介绍了单链表的两种创建方式——头插法与尾插法，相信大家现在对这两种方式都已经掌握了。今天咱们将继续介绍单链表的基本操作——查找、插入与删除。在开始今天的内容之前，我们先通过尾插法创建一个单链表，如......
Hive安装部署
引言ApacheHive是一款建立在Hadoop生态系统之上的数据仓库工具，它提供了一种SQL类似的查询语言（HiveQL）来查询和分析存储在Hadoop分布式文件系统（HDFS）中的大规模数据。Hive的设计目标是让用户可以在大规模数据集上执行复杂的查询，而无需深入了解MapReduce编程。在这篇文章......
MRS基础组件之HBase与Hive开发应用_tyt2023
MRS基础组件之HBase与Hive开发应用本实验基于MRS环境，介绍如何利用HBase与Hive来进行相关操作。其中，HBase主要介绍包括如何利用JavaAPI创建数据表、写入数据、查看数据以及删除数据；而Hive则通过介绍UDF、UDTF和UDAF等自定义函数的基本操作，讲解如何进行自定义数据处理和清洗作业。......
dremio hive jdbc arp date 类型问题记录
简单记录下碰到的一些问题分析arthasstack查看调用stackcom.mysql.cj.jdbc.result.ResultSetImplgetDate效果ffect(classcount:2,methodcount:4)costin329ms,listenerId:11ts=2023-12-2606:18:17;thread_name=e3-1a758f......
Hive的体系架构
Hello，大家好，上一篇博文聊了一下Hive的基本知识，为了让大家更深入地理解Hive，本篇就写一下Hive的体系架构吧。先看一张图：大概解释一下：command-lineshell&thrift/jdbc 可以用command-lineshell和thrift／jdbc两种方式来操作数据： ......
2数据库之Mysql基本操作
数据库基本类型、基本操作一.......
Hive“横空出世”的原因
在沸沸扬扬的大数据江湖里，有这么一个框架，它刚开始很低调，然而，就在那么一个不起眼的一天，突然展示出其绝妙的武功，让大数据各大框架的掌门人暗挑大拇指，好了，不卖关子了，这个“横空出世”的框架就是——Hive。一：Hive产生的背景万事有因果，Hive的出......

Hive基本操作

相关文章

赞助商

阅读排行