首页 > 其他分享 >hive知识点散记

hive知识点散记

时间:2023-10-03 12:12:01浏览次数:34  
标签:知识点 join 某列 column hive stu cname 散记 select

在不切换数据库的前提下查询某一数据库下的所有表    show tables in 数据库名;

查询显示某一张表的元数据信息    desc formatted 表名;

查询当前数据库名称    select current_databases();

对查询结果进行去重    select distinct cname from stu;  【不写distinct(或者写all)默认为all】【当distinct后又多个字段时候为整体去重】

 

一些聚合函数——

AVG(column)    返回某列的平均值

COUNT(column)   返回某列的行数(不包括NULL值)

COUNT(*)     返回被选行数

MAX(column)    返回某列的最高值

MIN(column)     返回某列的最低值

SUM(column)   返回某列的(数值的)总和

 

可以用 as  来更改列名

 

使用group by 的时候注意 筛选条件中的值 要么是group by 分组的字段,要么是被聚合函数应用的字段

——为了避免歧义

 

使用聚合函数的时候无法使用where,需要用having代替

——where比聚合语句先执行,聚合语句比having先执行

 

order by 可用于 根据指定列对结果进行排序    默认使用升序(ASC)  降序为DESC

 

limit可用于对输出结果的数量进行限制   

输出前3行        select cname from stu limit 3

从第2行开始输出3行     select cname from stu limit 2,3    注意此时第一行定义为0【参考数组】

 

查询过程中的执行顺序——

from > where > group(含聚合) > having > order > select

 

关于join——

join 即为 inner join,同sql

  select c.cname s.sname

  from course c join stu s

  on c.sid = s.sid;

隐式表示法——  

  select c.cname s.sname

  from course c , stu s

  where c.sid = s.sid;

左连接  left join  左外连接

连接时,左边为全部数据,右边有则显示数据,无则显示null

 

标签:知识点,join,某列,column,hive,stu,cname,散记,select
From: https://www.cnblogs.com/yansans/p/17740948.html

相关文章

  • LINUX:FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.
     如图,问题表现为linux中可直接通过hive进行数据插入但在通过datagrip却更改不了此时,可能时yarn的运行分配的内存较少,或堆内存溢出。在yarn-site.xml中更改,以及mapred-site.xml中更改,完成。yarn的<property><name>yarn.scheduler.minimum-allocation-mb</name>......
  • 44、Flink之module模块介绍及使用示例和Flink SQL使用hive内置函数及自定义函数详细示
    文章目录Flink系列文章一、模块Modules1、模块介绍2、模块类别ModuleTypes1)、CoreModule2)、HiveModule3)、User-DefinedModule3、模块生命周期和解析顺序ModuleLifecycleandResolutionOrder4、模块Modules的使用1)、SQL方式2)、编码方式-java二、HiveFunctions内置函数和自定......
  • linux中hive常用命令
     kill-929676杀死进程ps-ef|grep23697查看进程tail-flogs/hiveserver2.log查看2信息nohupbin/hive--servicehiveserver2>>logs/hiveserver2.log2>&1&后台加载报错和运行信息到2start-all.sh启动所有服务 ......
  • Fastapi 框架知识点总结
    【一】引入为什么Fastapi火【二】Starlette,Pydantic与FastAPI框架是什么关系?Starlette介绍Pydantic介绍三者之间的联系【三】Pydantic使用方法介绍类模型的定义及使用递归模型ORM操作【四】Fastapi环境搭建及初步使用Fastapi环境搭建注意不同版本的包......
  • 【十分钟一个知识点】数据管理、数据安全和大数据
    数据管理数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程计算机数据的管理已经经历了人工管理、文件管理、数据库管理三个阶段在计算机中,数据一般以文件的形式存储根据编码规则不同,文件格式不同在Windows系统中,用文件拓展名来表示某些特......
  • 【十分钟一个知识点】数据、信息、编码
    数据数据是对客观事物的符号表示信息没有统一的定义,但是我们日常生活中所认为的信息都只是信息的载体特征:载体依附性:信息无法独立存在,依附于载体时效性:信息反映事物某一时间的状态、内容共享性:信息可以共享,同一种信息可以同时被不同的接收者获取可加工处理性、真伪性:信息......
  • 奥数知识点 — 追及问题
    每日一课: 追及问题的要点及解题技巧1、多人相遇追及问题的概念及公式多人相遇追及问题,即在同一直线上,3个或3个以上的对象之间的相遇追及问题。所有行程问题都是围绕""这一条基本关系式展开的,比如我们遇到的两大典型行程题相遇问题和追及问题的本质也是这三个量之......
  • destoon关于archiver归档的性能优化
    今天在处理一个项目时候发现archiver单个模块归档超过百万数据,打开速度就特慢,所以打开archiver下index.php文件进行分析,发现有句sql作怪1$result = $db->query("SELECTtitle,linkurl,addtimeFROM{$table}WHERE$conditionORDERBYaddtimeDESCLIMIT$offset,......
  • Hive函数高阶——explode函数、UDAF聚合函数
    1、explode函数(输入一行,输出多行)引入lateralview侧视图的概念解决上面问题的限制:2、UDAF聚合函数增强聚合——groupingsets(相当于unionall)增强聚合——cube增强聚合——rollup(是cube的子集,以左侧维度为主)......
  • Hive函数入门——内置函数+用户定义函数
    1、内置函数1、字符串、时间类型函数之前也是在c语言里面学过,包括concat、split等;时间类型函数:前不久用到的函数:date_add--->当前日期的后的第几天的日期;date_sub--->当前日期的前的第几天的日期;2、数学函数、集合函数round--取整数值(还能指定保留的精度)floor--向下取整......