首页 > 其他分享 >数据仓库(十一)---hive使用小技巧积累(持续更新)

数据仓库(十一)---hive使用小技巧积累(持续更新)

时间:2023-08-08 11:32:12浏览次数:36  
标签:1024 name 查看 数据仓库 hive --- print table


我们在本章节会持续更新关于hive使用过程中的一些实用的小技巧

HIVE 查询显示列名 及 行转列显示

hive shell;
set hive.cli.print.header=true; // 打印列名 
set hive.cli.print.row.to.vertical=true; // 开启行转列功能, 前提必须开启打印列名功能 
set hive.cli.print.row.to.vertical.num=1; // 设置每行显示的列数

Hive查看数据表信息的方法

方法1:查看表的字段信息

desc table_name;

方法2:查看表的字段信息及元数据存储路径

desc extended table_name;

方法3:查看表的字段信息及元数据存储路径

desc formatted table_name;

备注:查看表元数据存储路径时,推荐方法3,信息比较清晰。

Hive查看表容量大小

方法1-ls

查看普通表的容量
查看一个hive表文件总大小时(单位为Byte),我们可以通过一行脚本快速实现,其命令如下:

$ hadoop fs -ls  /user/hive/warehouse/table_name|awk -F ' ' '{print $5}'|awk '{a+=$1}END{print a}'

列出该表的详细文件

$ hadoop fs -ls  /user/hive/warehouse/table_name

查看分区表的容量

$ hadoop fs -ls  /user/hive/warehouse/table_name/yyyymm=201802|awk -F ' ' '{print $5}'|awk '{a+=$1}END
{print a/(1024*1024*1024)}'

列出该表的详细文件列表

$ hadoop fs -ls  /user/hive/warehouse/table_name/yyyymm=201802

方法2-du

查看该表总容量大小,单位为G

$ hadoop fs -du /user/hive/warehouse/table_name|awk '{ SUM += $1 } END { print a/(1024*1024*1024)}'


标签:1024,name,查看,数据仓库,hive,---,print,table
From: https://blog.51cto.com/u_16218512/7006336

相关文章

  • 数据仓库(十二)---分布式SQL查询引擎---teradata版本的presto安装和使用
    我们在使用presto过程中,发现facebook原版和京东原版都是解压可用,teradata版本的安装要麻烦一些。下面对teradata版本的安装过程进行记录。首要条件1、需要python2.6或者python2.7环境之所以需要python环境是因为teradata版本的presto把安装封装成了集群式安装。根据配置在安装过......
  • ubuntu安装docker和docker-compose
      ubuntu系统docker和安装,并安装docker-compose安装dockeraptinstalldocker.io设置docker为开机自启systemctlenabledocker安装docker-composeaptinstalldocker-compose修改配置,设置国内镜像仓库和本地镜像仓库vi/etc/docker/daemon.json{"registry-......
  • 2023-8-8新版本数据录入指南
    人工费对应明细列入材料费对应明细列入机械费对应明细列入专业分包费用对应明细列入措施费对应明细列入间接费对应明细列入(注意其他费用不用录入这里)其他费用录入规费税金录入税金(不用录取税率)将税额填入基本信息如果含税金额差异不大(小数点后的区别)就完成了......
  • vue 线上环境 开启 vue-devtools
      vue项目打包正式环境时,是没有vue-devtools选项卡的,没法看vue内部的数据 选中Source选项卡,找到打包好的app.js,并格式化 ctrl+f搜索$mount并在new那里打断点,new后面的对象就是Vue对象,需要记住该变量名,下一步要用到F5刷新页面就就会进入断点,并在控制台......
  • web开发----jsp中通用模版的引用 include的用法
    web开发中常常会有一些代码需要多个页面使用,比如banner nav导航 还有footer等.ASP.NET开发中有母版页的说法,也就是写一些通用的模版页,然后其他页面可以引用。 jsp中 当然也有这样的用法 也就是include的用法 两种用法一种是说明标签<%@include file="xxx.jsp"%>,......
  • centos安装php php-fpm 以及 配置nginx
    下载php源码包http://www.php.net/downloads.php安装phptar-xvfphp-5.5.13.tar.bz2cdphp-5.5.13./configure--prefix=/usr/local/php--with-config-file-path=/etc--enable-inline-optimization--disable-debug--disable-rpath--enable-shared--enable-opcache--......
  • 1-3 多态、模板
    1多态多态分两类:静态多态:函数重载和运算符重载,即复用函数名动态多态:派生类和虚函数来实现运行时多态区别:静态多态在编译阶段确定函数地址动态多态在运行阶段确定函数地址,根据传入的对象不同确定具体的执行函数动态多态满足条件:首先要有继承关系子类要重写父类的虚......
  • TC脚本开发-梦幻诛仙自动登录思路梳理及源代码
    界面如下:设计思路是:最多5个号自动登录,从帐号一开始登记帐号,放入数组中。登记完之后点击登录 判断帐号数组中有多少个帐号,先后进行登录,调用自动登录函数。自动登录函数启动进程,根据图片点击按钮,根据角色变量来选择角色,点击进入游戏。代码如下:空间自动登录ts=com("ts.tssoft")......
  • 论文解读:《基于深度多核学习的用于识别 DNA n4 -甲基胞嘧啶位点的高阶模糊推理系统》
    Title:Adeepmultiplekernellearning-basedhigher-orderfuzzyinferencesystemforidentifyingDNAN4-methylcytosinesites期刊:InformationSciences中科院分区:一区(计算机科学技术)影像因子:8.1↓0.133文章链接:https://doi.org/10.1016/j.ins.2023.01.149Websever:Github:......
  • PostgreSQL-PITR 原理
    在 PostgreSQL的数据目录的pg_wal(10版本之前是pg_xlog子目录)子目录中始终维护一个WAL日志文件。该日志文件记录了数据库数据文件的每次改变。最初设计该日志文件的主要目的是为了数据库异常崩溃后,能够重放最后一次checkpoint点之后的日志文件,把数据库推到最终的一致状态,......