首页 > 其他分享 >HBase 快速入门(安装和命令操作)

HBase 快速入门(安装和命令操作)

时间:2023-01-19 10:04:07浏览次数:43  
标签:info 入门 bigdata student hbase 安装 HBase 1001



1 HBase 安装部署

1.1 Zookeeper 正常部署

首先保证 Zookeeper 集群的正常部署,并启动。

bin/zkServer.sh start
bin/zkServer.sh start
bin/zkServer.sh start

1.2 Hadoop 正常部署

Hadoop 集群的正常部署并启动。

sbin/start-dfs.sh
sbin/start-yarn.sh

1.3 HBase 的解压

1)解压 Hbase 到指定目录

tar -zxvf hbase-2.4.11-bin.tar.gz -C /opt/module/
mv /opt/module/hbase-2.4.11 /opt/module/hbase

2)配置环境变量

sudo vim /etc/profile.d/my_env.sh

添加

#HBASE_HOME
export HBASE_HOME=/opt/module/hbase
export PATH=$PATH:$HBASE_HOME/bin

3)使用 source 让配置的环境变量生效

source /etc/profile.d/my_env.sh

1.4 HBase 的配置文件

1)hbase-env.sh 修改内容(不使用hbase自带zk),可以添加到最后:

export HBASE_MANAGES_ZK=false

2)hbase-site.xml 修改内容:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>hbase.zookeeper.quorum</name>
<value>hadoop102,hadoop103,hadoop104</value>
<description>The directory shared by RegionServers.</description>
</property>
<!-- <property>-->
<!-- <name>hbase.zookeeper.property.dataDir</name>-->
<!-- <value>/export/zookeeper</value>-->
<!-- <description> 记得修改 ZK 的配置文件 -->
<!-- ZK 的信息不能保存到临时文件夹-->
<!-- </description>-->
<!-- </property>-->
<property>
<name>hbase.rootdir</name>
<value>hdfs://hadoop102:8020/hbase</value>
<description>The directory shared by RegionServers.</description>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
</configuration>

3)regionservers

hadoop102
hadoop103
hadoop104

4)解决 HBase 和 Hadoop 的 log4j 兼容性问题,修改 HBase 的 jar 包,使用 Hadoop 的 jar 包

mv /opt/module/hbase/lib/client-facingthirdparty/slf4j-reload4j-1.7.33.jar /opt/module/hbase/lib/clientfacing-thirdparty/slf4j-reload4j-1.7.33.jar.bak

1.5 HBase 远程发送到其他集群

xsync hbase/

1.6 HBase 服务的启动

1)单点启动

bin/hbase-daemon.sh start master
bin/hbase-daemon.sh start regionserver

2)集群启动

bin/start-hbase.sh

3)对应的停止服务

bin/stop-hbase.sh

1.7 查看 HBase 页面

启动成功后,可以通过“host:port”的方式来访问 HBase 管理页面,例如:​​http://ip:16010​​

1.8 高可用(可选)

在 HBase 中 HMaster 负责监控 HRegionServer 的生命周期,均衡 RegionServer 的负载,
如果 HMaster 挂掉了,那么整个 HBase 集群将陷入不健康的状态,并且此时的工作状态并不
会维持太久。所以 HBase 支持对 HMaster 的高可用配置。

1)关闭 HBase 集群(如果没有开启则跳过此步)

bin/stop-hbase.sh

2)在 conf 目录下创建 backup-masters 文件

touch conf/backup-masters

3)在 backup-masters 文件中配置高可用 HMaster 节点

echo hadoop103 > conf/backup-masters

4)将整个 conf 目录 scp 到其他节点

xsync conf

5)重启 hbase,打开页面测试查看
​http://ip:16010​​

2 HBase Shell 操作

2.1 基本操作

1)进入 HBase 客户端命令行

bin/hbase shell

2)查看帮助命令
 能够展示 HBase 中所有能使用的命令,主要使用的命令有 namespace 命令空间相关,DDL 创建修改表格,DML 写入读取数据。

help

2.2 namespace

1)创建命名空间
使用特定的 help 语法能够查看命令如何使用。

help 'create_namespace'

2)创建命名空间 bigdata

create_namespace 'bigdata'

3)查看所有的命名空间

list_namespace

2.3 DDL

1)创建表
在 bigdata 命名空间中创建表格 student,两个列族。info 列族数据维护的版本数为 5 个,如果不写默认版本数为 1。

create 'bigdata:student', {NAME => 'info', VERSIONS => 5}, {NAME => 'msg'}

如果创建表格只有一个列族,没有列族属性,可以简写。
如果不写命名空间,使用默认的命名空间 default。

create 'student1','info'

2)查看表
查看表有两个命令:list 和 describe
list:查看所有的表名

list

describe:查看一个表的详情

describe 'student'

3)修改表
表名创建时写的所有和列族相关的信息,都可以后续通过 alter 修改,包括增加删除列族。
(1)增加列族和修改信息都使用覆盖的方法

alter 'student', {NAME => 'f1', VERSIONS => 3}

(2)删除信息使用特殊的语法

alter 'student', NAME => 'f1', METHOD => 'delete' alter 'student', 'delete' => 'f1'

4)删除表
shell 中删除表格,需要先将表格状态设置为不可用。

disable 'student' drop 'student1'

2.4 DML

1)写入数据
在 HBase 中如果想要写入数据,只能添加结构中最底层的 cell。可以手动写入时间戳指定 cell 的版本,推荐不写默认使用当前的系统时间。

put 'bigdata:student','1001','info:name','zhangsan' put 'bigdata:student','1001','info:name','lisi' put 'bigdata:student','1001','info:age','18'

如果重复写入相同 rowKey,相同列的数据,会写入多个版本进行覆盖。

2)读取数据
读取数据的方法有两个:get 和 scan。
get 最大范围是一行数据,也可以进行列的过滤,读取数据的结果为多行 cell。

get 'bigdata:student','1001' get 'bigdata:student','1001' , {COLUMN => 'info:name'}

也可以修改读取 cell 的版本数,默认读取一个。最多能够读取当前列族设置的维护版本
数。

get 'bigdata:student','1001' , {COLUMN => 'info:name', VERSIONS => 6}

scan 是扫描数据,能够读取多行数据,不建议扫描过多的数据,推荐使用 startRow 和stopRow 来控制读取的数据,默认范围左闭右开。

scan 'bigdata:student',{STARTROW => '1001',STOPROW => '1002'}

实际开发中使用 shell 的机会不多,只做了解

3)删除数据
删除数据的方法有两个:delete 和 deleteall。
delete 表示删除一个版本的数据,即为 1 个 cell,不填写版本默认删除最新的一个版本。

delete 'bigdata:student','1001','info:name'

deleteall 表示删除所有版本的数据,即为当前行当前列的多个 cell。(执行命令会标记数据为要删除,不会直接将数据彻底删除,删除数据只在特定时期清理磁盘时进行)

#先写行,再写列 deleteall 'bigdata:student','1001','info:name'


标签:info,入门,bigdata,student,hbase,安装,HBase,1001
From: https://blog.51cto.com/u_14452299/6019783

相关文章

  • HBase API
    1环境准备新建项目后在pom.xml中添加依赖:注意:会报错javax.el包不存在,是一个测试用的依赖,不影响使用<dependencies><dependency><groupId>org.apache.hbase......
  • HBase 简介
    1HBase定义ApacheHBase是以hdfs为数据存储的,一种分布式、可扩展的NoSQL数据库。2HBase数据模型HBase的设计理念依据Google的BigTable论文,论文中对于数据模型......
  • Linux安装KingbaseES数据库 Unsupported major.minor version错误处理
    Linux系统安装V008R006C007B0012版本KingbaseES数据库报错:Unsupportedmajor.minorversion52.0系统版本:[root@vm-10-37-129-15~]#cat/etc/redhat-releaseRedHa......
  • manjaro下安装deb包
    尽管manjaro下的软件已经够多了,安装方式已经够灵活,官方的首推pacman,再推yay,实在不行还有aur,为了安装Xmind-for-Linux-amd64bit-22.11.3656.deb,先去官方下载包1、安装d......
  • Linux服务器 MATLAB 安装
    在Ubuntu安装配置MATLAB开发环境https://muzing.top/posts/52276c1/Linux下基于MobaXterm的无图形界面MatlabR2018a安装https://www.cnblogs.com/Jody9123/p/13447273......
  • Ubuntu 22.04 安装 VMware Tools
    VM下的installVMWareTools终端下载VMwareToolssudoaptinstallopen-vm-tools-desktop-yreboot......
  • 230118_50_SpringBoot入门
    yaml配置文件中,支持占位符配置person:name:bill${random.int}age:4happy:truebirth:2023/01/15maps:{k1:v1,k2:v2}hello:hellolists:-cat-dog-fish......
  • node+express+ multer 实现文件上传入门
    文件上传文件上传需要借助一个中间件multer因此我们需要安装cnpminstallmulter--save前端界面在express创建的项目下的public/upload目录下创建indexfileuplo......
  • 【2023.01.18】WinServer安装后要做的几件事
    修改管理员账号有很多的黑客会在公网ip上面进行扫描,因此如果将管理员账户名设为Administrator的话,很容易会导致RDP无法远程修改后进行重启打开远程记得还要查看自己......
  • 这可能是Matplotlib和Seaborn最全的入门文档
    matplotlib是python第一个数据可视化库,在数据分析,可视化领域的地位和贡献是无法磨灭的。但也正是因为有了这位老大哥的出现给后续基于matplotlib实现的绘图库实现了可能。......