一、了解Hbase
1、什么是hbase?
HBase是一个高可靠性,高性能、面向列,可伸缩的分布式存储系统,用于存储海量结构化或者半结构化,非结构化的数据(底层是字节数组做存储的)
二、HBase相关概念
1、数据模型(三维有序)
- 一个hbase表中,行键之间是按照字典顺序排序的
- 一行中每一个列名按照字典顺序
- 同一个列多个版本号数据,版本之间是按照字典顺序排序的
2、Hbase数据坐标
HBase中需要根据行键、列族、列限定符和时间戳来确定一个单元格(cell),cell中的数据是没有类型的,全部是字节码形式存贮。,因此,可以视为一个“四维坐标”,即[行键, 列族, 列限定符, 时间戳]。
3、HBase区域
HBase自动把表水平划分为区域(Region),每个区域都是有若干连续行构成的,一个区域由所属的表、起始行、终止行(不包括这行)三个要素来表示。
三、Hbase系统架构
四、HBase安装搭建
1、先在官网上下载对应版本的HBase
这里我们下载hbase-2.2.7
hbase-2.2.7-bin.tar.gz
2、上传解压到lunix虚拟机上
tar -zxvf hbase-1.4.6-bin.tar.gz
3、配置环境变量
export HBASE_HOME=/usr/local/soft/hbase-1.4.6
$HBASE_HOME/bin
配置完之后一定要source /etc/profile
4、修改hbase-env.sh文件
1、增加java配置
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
2、关闭默认zk配置(原本是注释的,放开修改false)
export HBASE_MANAGES_ZK=false
5、修改hbase-site.xml文件
修改以下配置
增加以下配置
6、修改regionservers文件
改为:
node1
node2
7、同步到所有节点
scp -r hbase-1.4.6 node1:pwd
scp -r hbase-1.4.6 node2:pwd
8、最后启动HBase
1、先启动zkServer
zkServer.sh start
所有节点都需要启动
2、启动hadoop
只需要在主节点master上启动
start-all.sh
3、启动Hbase
start-hbase.sh
出现如下进程说明启动成功!!!
4、进入hbase
hbase shell