首页 > 系统相关 >HBASE shell操作CLI

HBASE shell操作CLI

时间:2023-09-05 13:07:51浏览次数:52  
标签:f1 shell CLI scan t1 HBASE main hbase NAME

server查看

hbase(main)> status
hbase(main)> version

创建命名空间:

namespace指的是一个 表的逻辑分组 ,同一组中的表有类似的用途,相当于关系型数据库中的database

创建该命名空间的表:

hbase(main):060:0> create_namespace 'test1'
hbase(main):061:0> create 'test1:test','f1','f2'
create 'scores',{NAME=>'course',VERSIONS=>2}

查看有哪些表

hbase(main)> list
hbase(main)> describe 'member'

创建表 create

# 语法:create <table>, {NAME => <family>, VERSIONS => <VERSIONS>}
# 例如:创建表t1,有两个family name:f1,f2,且版本数均为2
hbase(main)> create 't1',{NAME => 'f1', VERSIONS => 2},{NAME => 'f2', VERSIONS => 2}

删除表

分两步:首先disable,然后drop
例如:删除表t1

hbase(main)> disable 't1'
hbase(main)> drop 't1'

查看表的结构

# 语法:describe <table>
# 例如:查看表t1的结构
hbase(main)> describe 't1'

修改表结构 alter

6)添加数据 put

修改表结构必须先disable
alter 't1', {NAME => 'f1', VERSIONS => 5}
# 语法:alter 't1', {NAME => 'f1'}, {NAME => 'f2', METHOD => 'delete'}
# 例如:修改表test1的cf的TTL为180天
hbase(main)> disable 'test1'
hbase(main)> alter 'test1',{NAME=>'body',TTL=>'15552000'},{NAME=>'meta', TTL=>'15552000'}
hbase(main)> enable 'test1'

添加数据 put

# 语法:put <table>,<rowkey>,<family:column>,<value>,<timestamp>
# 例如:给表t1的添加一行记录:rowkey是rowkey001,family name:f1,column name:col1,value:value01,timestamp:系统默认
hbase(main)> put 't1','rowkey001','f1:col1','value01'

查询数据

a)查询某行记录  get
# 语法:get <table>,<rowkey>,[<family:column>,....]
查询rowkey001一行下的所有列值:
hbase(main)> get 't1','rowkey001'
# 例如:查询表t1,rowkey001行,f1:col1列
hbase(main)> get 't1','rowkey001', 'f1:col1'
# 或者:
hbase(main)> get 't1','rowkey001', {COLUMN=>'f1:col1'}
 
b)扫描表
# 语法:scan <table>, {COLUMNS => [ <family:column>,.... ], LIMIT => num}
# 另外,还可以添加STARTROW、TIMERANGE和FITLER等高级功能
# 例如:扫描表t1的前5条数据
hbase(main)> scan 't1',{LIMIT=>5}
test1空间下的test表的columns=f1的所有行
hbase(main)> scan 'test1:test',{COLUMNS=>'f1'}
test1空间下的test表的columns=f1的第1行
hbase(main)> scan 'test1:test',{COLUMNS=>'f1',LIMIT=>1}
 
scan 'scores',{VERSIONS=>2}  version<=2
scan 'scores',{TIMERANGE=>[1394097631386,1394097651029],VERSIONS=>2}
c)查询表中的数据行数  count
# 语法:count <table>, {INTERVAL => intervalNum, CACHE => cacheNum}
# INTERVAL设置多少行显示一次及对应的rowkey,默认1000;CACHE每次去取的缓存区大小,默认是10,调整该参数可提高查询速度
# 例如,查询表t1中的行数,每100条显示一次,缓存区为500
hbase(main)> count 't1', {INTERVAL => 100, CACHE => 500}

删除数据

a )删除行中的某个列值  delete
# 语法:delete <table>, <rowkey>,  <family:column> , <timestamp>,必须指定列名
# 例如:删除表t1,rowkey001中的f1:col1的数据
hbase(main)> delete 't1','rowkey001','f1:col1'
注:将删除改行f1:col1列所有版本的数据
b )删除行  deleteall
# 语法:deleteall <table>, <rowkey>,  <family:column> , <timestamp>,可以不指定列名,删除整行数据
# 例如:删除表t1,rowk001的数据
hbase(main)> deleteall 't1','rowkey001'
c)删除表中的所有数据   truncate
# 语法: truncate <table>
# 其具体过程是:disable table -> drop table -> create table
# 例如:删除表t1的所有数据
hbase(main)> truncate 't1'

检查表是否存在 exists

hbase(main):019:0> exists 't1'

查看表是否可用  is_enabled

hbase(main):036:0> is_enabled 't1'

hbase(main)>  create help

判断表是否enable

hbase(main):034:0>is_enabled 'member'

过滤器

所有的过滤器都在服务端生效

1.显示所有过滤器

hbase(main):010:0> show_filters

2.只返回key及其他关键部分

scan 'airline',{ FILTER => "KeyOnlyFilter()"}

3.只返回每一行的第一个值

scan 'airline',{ FILTER => "FirstKeyOnlyFilter()"}

4.过滤rowkey 需要输入rowkey的前缀

scan 'airline', {FILTER => "(PrefixFilter ('row2'))"}

5.过虑qualifier,需要输入qualifier前缀

scan 'airline', {FILTER => "(PrefixFilter ('row2')) AND ColumnPrefixFilter('destination')"}

6.多重过滤qualifier,需要输入qualifier前缀

scan 'airline',{FILTER =>"MultipleColumnPrefixFilter('source','destination','date')"}

7.返回该表中相应的qualifier数

scan 'airline',{FILTER =>"ColumnCountGetFilter(2)"}

8.返回多少行

scan 'airline',{FILTER => "PageFilter(1)"}

9.扫描到哪一行停止

scan 'airline',{FILTER =>"InclusiveStopFilter('row1')"}

10.只返回有指定Qualifier的数据

scan 'airline',{ FILTER =>"QualifierFilter(=,'binary:flightno')"}   >  =   <来替换‘=’

11.返回满足条件(某一列的值)的数据

scan 'airline', { COLUMNS =>'flightbetween:source', LIMIT => 4, FILTER => "ValueFilter( =, 'binaryprefix:hyd' )" }     
>  =   <来替换‘=’

行的最大版本是通过 HColumnDescriptor定义在每一个列族的,默认的最大版本号是1不推荐设置最大版本号为很大的值(数百甚至更多)除非旧的数据十分重要。因为太多的版本会使 StoreFile 很大。

建表语句详解

create 'testtable',{NAME => 'Toutiao', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '10', COMPRESSION => 'LZO', TTL => '30000', IN_MEMORY => 'false', BLOCKCACHE => 'false'},
 {NAME => 'coulmn', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '30', COMPRESSION => 'LZO', TTL => '30000', IN_MEMORY => 'true'}

#其中的属性有:
REPLICATION_SCOPE 复制份数 ,只包含一个列簇“Toutiao”,
versions:设置历史版本数 默认为1,TTL:过期时间 单位为秒,默认为永久保存,
COMPRESSION:压缩方式,当配置lzo的情况)

BLOOMFILTER

布隆过滤器,优化HBase的随即读取性能,可选值NONE|ROW|ROWCOL,默认为NONE,该参数可以单独对某个列簇启用。启用过滤器,对于get操作以及部分scan操作可以剔除掉不会用到的存储文件,减少实际IO次数,提高随机读性能。Row类型适用于只根据Row进行查找,而RowCol类型适用于根据Row+Col联合查找,如下:

Row类型适用于:get ‘NewsClickFeedback’,’row1′
RowCol类型适用于:get ‘NewsClickFeedback’,’row1′,{COLUMN => ‘Toutiao’}

对于有随机读的业务,建议开启Row类型的过滤器,使用空间换时间,提高随机读性能。

COMPRESSION

数据压缩方式,HBase支持多种形式的数据压缩,一方面减少数据存储空间,一方面降低数据网络传输量进而提升读取效率。目前HBase支持的压缩算法主要包括三种:GZip | LZO | Snappy。Snappy的压缩率最低,但是编解码速率最高,对CPU的消耗也最小,目前一般建议使用Snappy

IN_MEMORY

数据是否常驻内存,默认为false。HBase为频繁访问的数据提供了一个缓存区域,缓存区域一般存储数据量小、访问频繁的数据,常见场景为元数据存储。默认情况,该缓存区域大小等于Jvm Heapsize * 0.2 * 0.25 ,假如Jvm Heapsize = 70G,存储区域的大小约等于3.2G。需要注意的是HBase Meta元数据信息存储在这块区域,如果业务数据设置为true而且太大会导致Meta数据被置换出去,导致整个集群性能降低,所以在设置该参数时需要格外小心。

BLOCKCACHE

是否开启block cache缓存,默认开启。

TTL

数据过期时间,单位为秒,默认为永久保存。对于很多业务来说,有时候并不需要永久保存某些数据,永久保存会导

标签:f1,shell,CLI,scan,t1,HBASE,main,hbase,NAME
From: https://blog.51cto.com/oldlees/7370433

相关文章

  • 在虚拟机下载eclipse软件
    1、打开火狐FireFox浏览器输入这个网址:https://www.eclipse.org/downloads/packages/release/Luna/SR2然后选择这个:右边的第三个Linux,进行下载;选择ok:下载完成之后,进行提取:选择主目录之后,然后点击右上角的提取:提取完成:可以点击显示文件,进行eclipse文件的查看;2、编辑......
  • 记一次eclipse导入的JavaEE项目无法连接数据库的排查
    1、问题描述Eclipse导入了一个JavaEE项目在虚拟机环境中新建了一个数据库数据库可以使用本地客户端工具正常连接导入的JavaEE项目修改了数据源配置无法启动相同的数据源配置通过在Idea新建的测试项目可以访问具体报错如下:java.sql.SQLRecoverableException:......
  • • • ​​​​ 目录​ • shell命令概述 • 获得命令帮助 • Linux命令行的格式 •
    shell命令概述Shell作用:命令解释器介于操作系统内核与用户之间,负责解释命令行获得命令帮助内部命令help命令的“--help”选项使用man命令阅读手册页命令行编辑的几个辅助操作Tab键:自动补齐反斜杠“\”:强制换行快捷键Ctrl+U:清空至行首快捷键Ctrl+K:清空至行尾快捷键Ctr......
  • • • ​​​​ 目录​ • shell命令概述 • 获得命令帮助 • Linux命令行的格式 •
    目录shell命令概述获得命令帮助Linux命令行的格式文件和目录管理Bash的命令历史Bash的命令别名重定向vim文本编辑器vim编辑器的工作模式命令模式中的基本操作末行模式中的基本操作用户和组账号概述用户账号文件——password用户账号文件——shadow组账号文件—group、gshadow添加用......
  • • • ​​​​ 目录​ • shell命令概述 • 获得命令帮助 • Linux命令行的格式 •
    目录shell命令概述获得命令帮助Linux命令行的格式文件和目录管理Bash的命令历史Bash的命令别名重定向vim文本编辑器vim编辑器的工作模式命令模式中的基本操作末行模式中的基本操作用户和组账号概述用户账号文件——password用户账号文件——shadow组账号文件—group、gshadow添加用......
  • Shell脚本Kill并重启进程
    #!/bin/bashJAR_PATH=kill.jarPID=$(ps-ef|grep$JAR_PATH|grep-vgrep|awk'{print$2}')if[-z$PID]thenecho"serviceisalreadystopped"elseecho"kill$PID"kill-9$PIDfisleep1nohupjava-jar......
  • 入门性文章要替新手多多考虑--csdn开发高手12期《利用Eclipse开发Hibernate应用程序》实
    注:本文使用Eclipse3.0.1(含中文包)测试,中英文请读者自行对应。  这篇文章总体写的不错,对于新手上路很有帮助。不过我在实践的时候也遇到了一些问题,在这里总结出来,希望大家少走弯路。1.Run的问题:“OK,Run一下”,作者仅提到这里,而对于新手,也许在这里就卡住了。怎么Run,Run什么啊?来,我......
  • ClickHouse一些调优的小技巧【持续更新】
     ClickHouse一些调优的小技巧 Q1:调试SQL时如何不返回数据结果?结尾适用formatNull即可,如:select*fromtable_namewhereid=1formatNull; Q2:默认情况下执行SQL都是尽可能的多线程以尽量使用资源,如何单线程执行SQL?由参数max_threads控制,如:select*fromtable_name......
  • 让linux shell显示命令执行结果
    vscode的shell可以用颜色来标记命令执行是否成功如图,蓝色圆点表示成功,红色表示失败。但是默认的shell不可以。通过设置PS1可以实现这个功能。在.bashrc文件中找到:if[-n"$force_color_prompt"];thenif[-x/usr/bin/tput]&&tputsetaf1>&/dev/null;then #We......
  • Eclipse+WTP+Tomcat开发的几点注意事项
    作者fbysss关键字:eclipse,wtp,tomcat       new一个server之后,会自动建立一个目录workspace/Servers/Tomcatv5.5Server@localhost-config,里面的几个文件,来自tomcat的conf目录      一旦服务运行,将自动在workspace/.metadata/.plugins/org.eclipse.wst.serv......