首页 > 其他分享 >Hive基本操作

Hive基本操作

时间:2023-12-30 18:11:08浏览次数:27  
标签:hdfs CREATE Hive emp 基本操作 deptno txt data

  Hive的基本操作很简单,与SQL的写法很类似,总结如下:

    进入Hive环境

        $HIVE_HOME/bin/hive

  数据库操作   

          CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES           (property_name=property_value, ...)];

CREATE DATABASE IF NOT EXISTS hive;

CREATE DATABASE IF NOT EXISTS hive2 LOCATION '/test/location';

CREATE DATABASE IF NOT EXISTS hive3 WITH DBPROPERTIES('creator'='pk');

/user/hive/warehouse是Hive默认的存储在HDFS上的路径

  表操作

    CREATE TABLE emp(

        empno int, ename string,

        job string, mgr int, hiredate string,

        sal double, comm double, deptno int )

        ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

   加载数据到emp表        

  • 追加Linux本地文件里的数据到emp表

        load data local inpath '/home/hadoop/data/emp.txt' into table emp;

  • overwrite覆盖操作,使用Linux本地文件里的数据覆盖掉原来emp表的数据

  load data local inpath '/home/hadoop/data/emp.txt' overwrite into table emp;

  • 将hdfs上某文件里的数据追加到emp表(此操作完毕后,hdfs上的该文件就自动删除)

  load data inpath 'hdfs://hadoop000:8020/data/emp.txt' into table emp;

  • overwrite覆盖操作,使用hdfs上某文件里的数据覆盖掉emp表的数据(此操作完毕后,hdfs上的该文件就自动删除)

    load data inpath 'hdfs://hadoop000:8020/data/emp.txt' overwrite into table emp;

   聚合: max/min/sum/avg

   分组函数: group by 求每个部门的平均工资

  select deptno, avg(sal) from emp group by deptno;

  join : 多表连接 (emp表与dept表连接) 

  CREATE TABLE dept( deptno int, dname string, loc string ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

   LOAD DATA LOCAL INPATH '/home/hadoop/data/dept.txt' OVERWRITE INTO TABLE dept;

   select e.empno,e.ename,e.sal,e.deptno,d.dname from emp e join dept d on e.deptno=d.deptno;

标签:hdfs,CREATE,Hive,emp,基本操作,deptno,txt,data
From: https://www.cnblogs.com/tianpan666/p/17936617.html

相关文章

  • 【数据结构】C语言实现双链表的基本操作
    双链表导言大家好,很高兴又和大家见面啦!!!经过前面几个篇章的内容分享,相信大家对顺序表和单链表的基本操作都已经熟练掌握了。今天咱们将继续分享线性表的链式存储的第二种形式——双链表。在今天的内容中,咱们将介绍双链表的创建以及一些基本操作,接下来跟我一起来看看吧!一、单链表与双......
  • 华为云耀云服务器L实例-大数据学习-Hive的部署-1
     华为云耀云服务器L实例-大数据学习-Hive的部署-1  产品官网:https://www.huaweicloud.com/product/hecs-light.html  今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例,介绍Hive的部署 Hive 是建立在 Hado......
  • 华为云耀云服务器L实例--Hive的部署
     华为云耀云服务器L实例--Hive的部署  产品官网:https://www.huaweicloud.com/product/hecs-light.html  今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例,继续Hive的部署 Hive 是建立在 Hadoop 上的一个......
  • 【数据结构】C语言实现单链表的基本操作
    单链表基本操作的实现导言大家好,很高兴又和大家见面啦!!!在上一篇中,我们详细介绍了单链表的两种创建方式——头插法与尾插法,相信大家现在对这两种方式都已经掌握了。今天咱们将继续介绍单链表的基本操作——查找、插入与删除。在开始今天的内容之前,我们先通过尾插法创建一个单链表,如......
  • Hive安装部署
    引言ApacheHive是一款建立在Hadoop生态系统之上的数据仓库工具,它提供了一种SQL类似的查询语言(HiveQL)来查询和分析存储在Hadoop分布式文件系统(HDFS)中的大规模数据。Hive的设计目标是让用户可以在大规模数据集上执行复杂的查询,而无需深入了解MapReduce编程。在这篇文章......
  • MRS基础组件之HBase与Hive开发应用_tyt2023
    MRS基础组件之HBase与Hive开发应用本实验基于MRS环境,介绍如何利用HBase与Hive来进行相关操作。其中,HBase主要介绍包括如何利用JavaAPI创建数据表、写入数据、查看数据以及删除数据;而Hive则通过介绍UDF、UDTF和UDAF等自定义函数的基本操作,讲解如何进行自定义数据处理和清洗作业。......
  • dremio hive jdbc arp date 类型问题记录
    简单记录下碰到的一些问题分析arthasstack查看调用stackcom.mysql.cj.jdbc.result.ResultSetImplgetDate效果ffect(classcount:2,methodcount:4)costin329ms,listenerId:11ts=2023-12-2606:18:17;thread_name=e3-1a758f......
  • Hive的体系架构
      Hello,大家好,上一篇博文聊了一下Hive的基本知识,为了让大家更深入地理解Hive,本篇就写一下Hive的体系架构吧。  先看一张图: 大概解释一下:command-lineshell&thrift/jdbc     可以用command-lineshell和thrift/jdbc两种方式来操作数据:    ......
  • 2数据库之Mysql基本操作
                                                                                                      数据库基本类型、基本操作一.......
  • Hive“横空出世”的原因
         在沸沸扬扬的大数据江湖里,有这么一个框架,它刚开始很低调,然而,就在那么一个不起眼的一天,突然展示出其绝妙的武功,让大数据各大框架的掌门人暗挑大拇指,好了,不卖关子了,这个“横空出世”的框架就是——Hive。    一:Hive产生的背景    万事有因果,Hive的出......