高可用 ZooKeeper 集群部署（进阶中级）

标签：src 进阶 root ZooKeeper hadoop 集群 usr master local

高可用 ZooKeeper 集群部署（进阶中级）

免密登录

[root@master ~]# ssh-keygen
[root@master ~]# ssh-copy-id root@slave1
[root@master ~]# ssh-copy-id root@slave2
[root@master ~]# ssh slave1
Last login: Tue May 23 22:10:27 2023 from 192.168.100.1
[root@slave1 ~]# exit
logout
Connection to slave1 closed.
[root@master ~]#

1. 实验任务一：ZooKeeper 安装部署

1.1. 步骤一：安装 ZooKeeper

[root@master src]# cd
[root@master ~]# ls
anaconda-ks.cfg  zookeeper-3.4.8.tar.gz
[root@master ~]# tar xf zookeeper-3.4.8.tar.gz -C /usr/local/src/
[root@master ~]# cd /usr/local/src/
[root@master src]# ls
hadoop  jdk  zookeeper-3.4.8
[root@master src]# mv zookeeper-3.4.8/ zookeeper
[root@master src]# ls
hadoop  jdk  zookeeper

1.2.步骤二：创建 ZooKeeper 数据目录

[root@master src]# cd zookeeper/
[root@master zookeeper]# ls
bin          contrib          ivy.xml      README_packaging.txt  zookeeper-3.4.8.jar
build.xml    dist-maven       lib          README.txt            zookeeper-3.4.8.jar.asc
CHANGES.txt  docs             LICENSE.txt  recipes               zookeeper-3.4.8.jar.md5
conf         ivysettings.xml  NOTICE.txt   src                   zookeeper-3.4.8.jar.sha1
[root@master zookeeper]# mkdir data
[root@master zookeeper]# mkdir logs
[root@master zookeeper]# ls
bin          data             lib                   README.txt               zookeeper-3.4.8.jar.md5
build.xml    dist-maven       LICENSE.txt           recipes                  zookeeper-3.4.8.jar.sha1
CHANGES.txt  docs             logs                  src
conf         ivysettings.xml  NOTICE.txt            zookeeper-3.4.8.jar
contrib      ivy.xml          README_packaging.txt  zookeeper-3.4.8.jar.asc

2.实验任务二：ZooKeeper 文件参数配置

2.1. 步骤一：配置 ZooKeeper 环境变量

[root@master ~]# vi /etc/profile.d/zookeeper.sh

export JAVA_HOME=/usr/local/src/java 
export PATH=$PATH:$JAVA_HOME/bin
export ZK_HOME=/usr/local/src/zookeeper
export PATH=$PATH:$ZK_HOME/bin

2.2. 步骤二：修改 zoo.cfg 配置文件

[root@master ~]# cd /usr/local/src/zookeeper/conf
[root@master conf]# ls
configuration.xsl  log4j.properties  zoo_sample.cfg
[root@master conf]# cp zoo_sample.cfg zoo.cfg
[root@master conf]# vi zoo.cfg 
#添加并更改如下配置：
#修改
dataDir=/usr/local/src/zookeeper/data
#增加
dataLogDir=/usr/local/src/zookeeper/logs
server.1=master:2888:3888
server.2=slave1:2888:3888
server.3=slave2:2888:3888

2.3. 步骤三：创建 myid 配置文件

[root@master conf]# cd ..
[root@master zookeeper]# cd data/
[root@master data]# echo "1" > myid
[root@master data]# cat myid
1

3. 实验任务三：ZooKeeper 集群启动

3.1. 步骤一：分发 ZooKeeper 集群

[root@master ~]# scp -r /usr/local/src/zookeeper/ root@slave1:/usr/local/src/
[root@master ~]# scp -r /usr/local/src/zookeeper/ root@slave2:/usr/local/src/
#分发环境变量并使其生效
[root@master ~]# scp /etc/profile.d/zookeeper.sh root@slave1:/etc/profile.d/
zookeeper.sh                                                             100%  141   103.4KB/s   00:00    
[root@master ~]# scp /etc/profile.d/zookeeper.sh root@slave2:/etc/profile.d/
zookeeper.sh                                                             100%  141    38.1KB/s   00:00

3.2. 步骤二：修改 myid 配置

[root@master zookeeper]# cd data
[root@master data]# ls
myid
[root@master data]# cat myid
1
[root@slave1 ~]# cd /usr/local/src/zookeeper/data/
[root@slave1 data]# echo "2" > myid
[root@slave1 data]# cat myid 
2
[root@slave2 ~]# cd /usr/local/src/zookeeper/data/
[root@slave2 data]# echo "3" > myid
[root@slave2 data]# cat myid 
3

3.3. 步骤三：修改 ZooKeeper 安装目录的归属用户为 hadoop 用户。

[root@master data]# # chown -R hadoop:hadoop /usr/local/src/zookeeper
[root@slave1 data]# # chown -R hadoop:hadoop /usr/local/src/zookeepe
[root@slave2 data]# # chown -R hadoop:hadoop /usr/local/src/zookeepe

3.4. 步骤四：启动 ZooKeeper 集群

关闭防火墙
[root@master data]# systemctl stop firewalld.service
[root@slave1 data]# systemctl stop firewalld.service
[root@slave2 data]# systemctl stop firewalld.service
关闭防火墙自启
[root@master data]# systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
[root@slave1 data]# systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
[root@slave2 data]# systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.

#同时启动三个节点的 zookeeper
[hadoop@master ~]$ zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /usr/local/src/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[hadoop@master ~]$ zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/src/zookeeper/bin/../conf/zoo.cfg
Mode: follower

[hadoop@slave1 ~]$ zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /usr/local/src/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[hadoop@slave1 ~]$ zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/src/zookeeper/bin/../conf/zoo.cfg
Mode: leader

[hadoop@slave2 ~]$ zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /usr/local/src/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[hadoop@slave2 ~]$ zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/src/zookeeper/bin/../conf/zoo.cfg
Mode: follower

2. 实验二 Hadoop HA 集群部署

1.实验任务一：Hadoop HA 文件参数配置

1.1. 步骤一：解压安装 Hadoop

[root@master ~]# ls
anaconda-ks.cfg  hadoop-2.7.1.tar.gz  zookeeper-3.4.8.tar.gz
[root@master ~]# tar xf hadoop-2.7.1.tar.gz -C /usr/local/src/

1.2步骤二：更改 hadoop 文件名

[root@master src]# mv hadoop-2.7.1/ hadoop
[root@master src]# ls
hadoop  jdk  zookeeper

1.3. 步骤三：配置 hadoop 环境变量

[root@master src]# vi /etc/profile.d/hadoop.sh
export HADOOP_HOME=/usr/local/src/hadoop 
export HADOOP_PREFIX=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export JAVA_HOME=/usr/local/src/java 
export PATH=$PATH:$JAVA_HOME/bin
export ZK_HOME=/usr/local/src/zookeeper
export PATH=$PATH:$ZK_HOME/bin

1.4.步骤四：配置 hadoop-env.sh 配置文件

[root@master src]# cd hadoop/etc/hadoop/
[root@master hadoop]# vi hadoop-env.sh 
#在最下面添加如下配置：
export JAVA_HOME=/usr/local/src/java

1.5. 步骤五：配置 core-site.xml 配置文件

[root@master hadoop]# vi core-site.xml

<!-- 指定 hdfs 的 nameservice 为 mycluster -->
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://mycluster</value>
</property>
<property>
    <name>hadoop.tmp.dir</name>
    <value>file:/usr/local/src/hadoop/tmp</value>
</property>
<!-- 指定 zookeeper 地址 -->
<property>
    <name>ha.zookeeper.quorum</name>
    <value>master:2181,slave1:2181,slave2:2181</value>
</property>
<!-- hadoop 链接 zookeeper 的超时时长设置 -->
<property>
    <name>ha.zookeeper.session-timeout.ms</name>
    <value>30000</value>
    <description>ms</description>
</property>
<property>
    <name>fs.trash.interval</name>
    <value>1440</value>
</property>

1.6. 步骤六：配置 hdfs-site.xml 配置文件

[root@master hadoop]# vi hdfs-site.xml 
< property >
    < name > dfs.qjournal.start - segment.timeout.ms < / name >
    < value > 60000 < / value >
< / property >
< property >
    < name > dfs.nameservices < / name >
    < value > mycluster < / value >
< / property >
< property >
    < name > dfs.ha.namenodes.mycluster < / name >
    < value > master, slave1 < / value >
< / property >
< property >
    < name > dfs.namenode.rpc - address.mycluster.master < / name >
    < value > master: 8020 < / value >
< / property >
< property >
    < name > dfs.namenode.rpc - address.mycluster.slave1 < / name >
    < value > slave1: 8020 < / value >
< / property >
< property >
    < name > dfs.namenode.http - address.mycluster.master < / name >
    < value > master: 50070 < / value >
< / property >
< property >
    < name > dfs.namenode.http - address.mycluster.slave1 < / name >
    < value > slave1: 50070 < / value >
< / property >
< property >
    < name > dfs.namenode.shared.edits.dir < / name >
    < value > qjournal: // master: 8485;slave1: 8485;slave2: 8485 / mycluster < / value >
< / property >
< property >
    < name > dfs.client.failover.proxy.provider.mycluster < / name >
    < value > org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider < / value >
< / property >
< property >
    < name > dfs.ha.fencing.methods < / name >
    < value >
    sshfence
    shell( / bin / true)
    < / value >
< / property >
< property >
    < name > dfs.permissions.enabled < / name >
    < value > false < / value >
< / property >
< property >
    < name > dfs.support.append < / name >
    < value > true < / value >
< / property >
< property >
    < name > dfs.ha.fencing.ssh.private - key - files < / name >
    < value > / root /.ssh / id_rsa < / value >
< / property >
< property >
    < name > dfs.replication < / name >
    < value > 2 < / value >
< / property >
< property >
    < name > dfs.namenode.name.dir < / name >
    < value > / usr / local / src / hadoop / tmp / hdfs / nn < / value >
< / property >
< property >
    < name > dfs.datanode.data.dir < / name >
    < value > / usr / local / src / hadoop / tmp / hdfs / dn < / value >
< / property >
< property >
    < name > dfs.journalnode.edits.dir < / name >
    < value > / usr / local / src / hadoop / tmp / hdfs / jn < / value >
< / property >
< property >
    < name > dfs.ha.automatic - failover.enabled < / name >
    < value > true < / value >
< / property >
< property >
    < name > dfs.webhdfs.enabled < / name >
    < value > true < / value >
< / property >
< property >
    < name > dfs.ha.fencing.ssh.connect - timeout < / name >
    < value > 30000 < / value >
< / property >
< property >
    < name > ha.failover - controller.cli - check.rpc - timeout.ms < / name >
    < value > 60000 < / value >
< / property >

1.7. 步骤七：配置 mapred-site.xml 配置文件

[root@master hadoop]# cp mapred-site.xml.template mapred-site.xml
[root@master hadoop]# vi mapred-site.xml

<!-- 指定 mr 框架为 yarn 方式 -->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
<!-- 指定 mapreduce jobhistory 地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>master:10020</value>
</property>
<!-- 任务历史服务器的 web 地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>master:19888</value>
</property>

1.8. 步骤八：配置 yarn-site.xml 配置文件

[root@master hadoop]# vi yarn-site.xml

<!-- Site specific YARN configuration properties -->
<!-- 开启 RM 高可用 -->
<property>
    <name>yarn.resourcemanager.ha.enabled</name>
    <value>true</value>
</property>
<!-- 指定 RM 的 cluster id -->
<property>
    <name>yarn.resourcemanager.cluster-id</name>
    <value>yrc</value>
</property>
<!-- 指定 RM 的名字 -->
<property>
    <name>yarn.resourcemanager.ha.rm-ids</name>
    <value>rm1,rm2</value>
</property>
<!-- 分别指定 RM 的地址 -->
<property>
    <name>yarn.resourcemanager.hostname.rm1</name>
    <value>master</value>
</property>
<property>
    <name>yarn.resourcemanager.hostname.rm2</name>
    <value>slave1</value>
</property>
<!-- 指定 zk 集群地址 -->
<property>
    <name>yarn.resourcemanager.zk-address</name>
    <value>master:2181,slave1:2181,slave2:2181</value>
</property>
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>86400</value>
</property>
<!-- 启用自动恢复 -->
<property>
    <name>yarn.resourcemanager.recovery.enabled</name>
    <value>true</value>
</property>
<!-- 制定 resourcemanager 的状态信息存储在 zookeeper 集群上 -->
<property>
    <name>yarn.resourcemanager.store.class</name>
    <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>

1.9. 步骤九：配置 slaves 配置文件

[root@master hadoop]# vi slaves

master
slave1
slave2

1.10. 步骤十：解压包到指定目录

namenode、datanode、journalnode 等存放数据的公共目录为/usr/local/src/hadoop/tmp；

[root@master hadoop]# mkdir -p /usr/local/src/hadoop/tmp/hdfs/nn
[root@master hadoop]# mkdir -p /usr/local/src/hadoop/tmp/hdfs/dn
[root@master hadoop]# mkdir -p /usr/local/src/hadoop/tmp/hdfs/jn
[root@master hadoop]# mkdir -p /usr/local/src/hadoop/tmp/logs

1.11. 步骤十一：分发文件

[root@master hadoop]# scp -r /etc/profile.d/hadoop.sh root@slave1:/etc/profile.d/
hadoop.sh                                        100%  602    41.7KB/s   00:00    
[root@master hadoop]# scp -r /etc/profile.d/hadoop.sh root@slave2:/etc/profile.d/
hadoop.sh                                        100%  602   517.3KB/s   00:00  
[root@master hadoop]# scp -r /usr/local/src/hadoop root@slave1:/usr/local/src/
[root@master hadoop]# scp -r /usr/local/src/hadoop root@slave2:/usr/local/src/

1.12. 步骤十二：修改目录所有者和所有者组

[root@master ~]# chown -R hadoop:hadoop /usr/local/src/hadoop/ 
[root@slave1 ~]# chown -R hadoop:hadoop /usr/local/src/hadoop/
[root@slave2 ~]# chown -R hadoop:hadoop /usr/local/src/hadoop/

实验一：高可用集群启动

实验任务一：HA 的启动

1.1. 步骤一：启动 journalnode 守护进程

[hadoop@master ~]$ hadoop-daemons.sh start journalnode
master: starting journalnode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-journalnode-master.out
slave1: starting journalnode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-journalnode-slave1.out
slave2: starting journalnode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-journalnode-slave2.out

1.2. 步骤二：初始化 namenode

[hadoop@master ~]$ hdfs namenode -format
23/05/28 08:14:19 INFO namenode.NameNode: STARTUP_MSG: 
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = master/192.168.100.10
STARTUP_MSG:   args = [-format]
STARTUP_MSG:   version = 2.7.1
STARTUP_MSG:   classpath = /usr/local/src/hadoop/etc/hadoop:/usr/local/src/hadoop/share/hadoop/common/lib/commons-configuration-1.6.jar:/usr/local/src/hadoop/share/hadoop/common/lib/curator-client-2.7.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/gson-2.2.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/activation-1.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jackson-jaxrs-1.9.13.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jsp-api-2.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jaxb-impl-2.2.3-1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/apacheds-kerberos-codec-2.0.0-M15.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-io-2.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/paranamer-2.3.jar:/usr/local/src/hadoop/share/hadoop/common/lib/httpclient-4.2.5.jar:/usr/local/src/hadoop/share/hadoop/common/lib/log4j-1.2.17.jar:/usr/local/src/hadoop/share/hadoop/common/lib/htrace-core-3.1.0-incubating.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jets3t-0.9.0.jar:/usr/local/src/hadoop/share/hadoop/common/lib/zookeeper-3.4.6.jar:/usr/local/src/hadoop/share/hadoop/common/lib/hadoop-auth-2.7.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/java-xmlbuilder-0.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jettison-1.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/slf4j-api-1.7.10.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jersey-server-1.9.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jackson-mapper-asl-1.9.13.jar:/usr/local/src/hadoop/share/hadoop/common/lib/avro-1.7.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-codec-1.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-cli-
.....
retain 1 images with txid >= 0
23/05/28 08:14:41 INFO util.ExitUtil: Exiting with status 0
23/05/28 08:14:41 INFO namenode.NameNode: SHUTDOWN_MSG: 
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at master/192.168.100.10
************************************************************/

1.3. 步骤三：注册 ZNode

[hadoop@master ~]$ hdfs zkfc -formatZK
23/05/28 08:16:36 INFO tools.DFSZKFailoverController: Failover controller configured for NameNode NameNode at master/192.168.100.10:8020
23/05/28 08:16:36 INFO zookeeper.ZooKeeper: Client environment:zookeeper.version=3.4.6-1569965, built on 02/20/2014 09:09 GMT
23/05/28 08:16:36 INFO zookeeper.ZooKeeper: Client environment:host.name=master
23/05/28 08:16:36 INFO zookeeper.ZooKeeper: Client environment:java.version=1.8.0_152
23/05/28 08:16:36 INFO zookeeper.ZooKeeper: Client environment:java.vendor=Oracle Corporation
23/05/28 08:16:36 INFO zookeeper.ZooKeeper: Client environment:java.home=/usr/local/src/jdk/jre
23/05/28 08:16:36 INFO zookeeper.ZooKeeper: Client environment:java.class.path=/usr/local/src/hadoop/etc/hadoop:/usr/local/src/hadoop/share/hadoop/common/lib/commons-configuration-1.6.jar:/usr/local/src/hadoop/share/hadoop/common/lib/curator-client-2.7.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/gson-2.2.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/activation-1.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jackson-jaxrs-1.9.13.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jsp-api-2.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jaxb-impl-2.2.3-1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/apacheds-kerberos-codec-2.0.0-M15.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-io-2.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/paranamer-2.3.jar:/usr/local/src/hadoop/share/hadoop/common/lib/httpclient-4.2.5.jar:/usr/local/src/hadoop/share/hadoop/common/lib/log4j-1.2.17.jar:/usr/local/src/hadoop/share/hadoop/common/lib/htrace-core-3.1.0-incubating.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jets3t-0.9.0.jar:/usr/local/src/hadoop/share/hadoop/common/lib/zookeeper-3.4.6.jar:/usr/local/src/hadoop/share/hadoop/common/lib/hadoop-auth-2.7.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/java-xmlbuilder-0.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jettison-1.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/slf4j-api-1.7.10.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jersey-server-1.9.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jackson-mapper-asl-1.9.13.jar:/usr/local/src/hadoop/share/hadoop/common/lib/avro-1.7.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-codec-1.4.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-cli-1.2.jar:/usr/local/src/hadoop/share/hadoop/common/lib/curator-recipes-2.7.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-net-3.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jetty-util-6.1.26.jar:/usr/local/src/hadoop/share/hadoop/common/lib/protobuf-java-2.5.0.jar:/usr/local/src/hadoop/share/hadoop/common/lib/hadoop-annotations-2.7.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/netty-3.6.2.Final.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-digester-1.8.jar:/usr/local/src/hadoop/share/hadoop/common/lib/guava-11.0.2.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-compress-1.4.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jsch-0.1.42.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-beanutils-1.7.0.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jersey-core-1.9.jar:/usr/local/src/hadoop/share/hadoop/common/lib/api-util-1.0.0-M20.jar:/usr/local/src/hadoop/share/hadoop/common/lib/api-asn1-api-1.0.0-M20.jar:/usr/local/src/hadoop/share/hadoop/common/lib/xz-1.0.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-httpclient-3.1.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-beanutils-core-1.8.0.jar:/usr/local/src/hadoop/share/hadoop/common/lib/stax-api-1.0-2.jar:/usr/local/src/hadoop/share/hadoop/common/lib/asm-3.2.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jackson-xc-1.9.13.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-logging-1.1.3.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jersey-json-1.9.jar:/usr/local/src/hadoop/share/hadoop/common/lib/jsr305-3.0.0.jar:/usr/local/src/hadoop/share/hadoop/common/lib/commons-collections-3.2.1
......

1.4. 步骤四：启动 hdfs

[hadoop@master ~]$  start-dfs.sh
Starting namenodes on [slave1 master]
master: starting namenode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-namenode-master.out
slave1: starting namenode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-namenode-slave1.out
slave2: starting datanode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-datanode-slave2.out
master: starting datanode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-datanode-master.out
slave1: starting datanode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-datanode-slave1.out
Starting journal nodes [master slave1 slave2]
master: journalnode running as process 1461. Stop it first.
slave2: journalnode running as process 1269. Stop it first.
slave1: journalnode running as process 1259. Stop it first.
Starting ZK Failover Controllers on NN hosts [slave1 master]
master: starting zkfc, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-zkfc-master.out
slave1: starting zkfc, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-zkfc-slave1.out

1.5. 步骤五：启动 yarn

[hadoop@master ~]$ start-yarn.sh
starting yarn daemons
starting resourcemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-resourcemanager-master.out
slave1: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-nodemanager-slave1.out
slave2: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-nodemanager-slave2.out
master: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-nodemanager-master.out

1.6. 步骤六：同步 master 数据

复制 namenode 元数据到其它节点(在 master 节点执行)

[hadoop@master ~]$ scp -r /usr/local/src/hadoop/tmp/hdfs/nn/* slave1:/usr/local/src/hadoop/tmp/hdfs/nn/
VERSION                                          100%  206   313.1KB/s   00:00    
seen_txid                                        100%    2     4.3KB/s   00:00    
fsimage_0000000000000000000.md5                  100%   62   157.1KB/s   00:00    
fsimage_0000000000000000000                      100%  353   719.7KB/s   00:00    
in_use.lock                                      100%   11    21.6KB/s   00:00    
[hadoop@master ~]$ scp -r /usr/local/src/hadoop/tmp/hdfs/nn/* slave2:/usr/local/src/hadoop/tmp/hdfs/nn/
VERSION                                          100%  206   104.4KB/s   00:00    
seen_txid                                        100%    2     2.0KB/s   00:00    
fsimage_0000000000000000000.md5                  100%   62    65.8KB/s   00:00    
fsimage_0000000000000000000                      100%  353   334.5KB/s   00:00    
in_use.lock                                      100%   11     9.2KB/s   00:00

1.7. 步骤七：在 slave1 上启动 resourcemanager 和 namenode 进程

[hadoop@slave1 ~]$  yarn-daemon.sh start resourcemanager
starting resourcemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-resourcemanager-slave1.out
[hadoop@slave1 ~]$ hadoop-daemon.sh start namenode
namenode running as process 1345. Stop it first.

1.8. 步骤九：启动 MapReduce 任务历史服务器

[hadoop@master ~]$  yarn-daemon.sh start proxyserver
starting proxyserver, logging to /usr/local/src/hadoop/logs/yarn-hadoop-proxyserver-master.out
[hadoop@master ~]$ jps
2177 DFSZKFailoverController
2306 ResourceManager
1460 JournalNode
2421 NodeManager
1734 NameNode
2810 Jps
1339 QuorumPeerMain
1871 DataNode
[hadoop@master ~]$ mr-jobhistory-daemon.sh start historyserver
starting historyserver, logging to /usr/local/src/hadoop/logs/mapred-hadoop-historyserver-master.out

1.9. 步骤十：查看端口和进程

#master
[hadoop@master ~]$ jps
2177 DFSZKFailoverController
2849 JobHistoryServer
2306 ResourceManager
1460 JournalNode
2421 NodeManager
1734 NameNode
1339 QuorumPeerMain
2893 Jps
1871 DataNode
#slave1
[hadoop@slave1 ~]$ jps
1411 JournalNode
1317 QuorumPeerMain
2552 Jps
2473 NameNode
1740 DFSZKFailoverController
2351 ResourceManager
2451 NodeManager
1891 DataNode
#slave2
[hadoop@slave2 ~]$ jps
1252 QuorumPeerMain
1576 NodeManager
1434 DataNode
1340 JournalNode
1708 Jps

master:50070

slave1:50070

master:8088

2.实验任务二：HA 的测试

2.1. 步骤一：创建一个测试文件

[hadoop@master ~]$ vi y.txt

Hello World
Hello Hadoop

.2.2. 步骤二：在 hdfs 创建文件夹

[hadoop@master ~]$ hadoop fs -mkdir /input

.2.3. 步骤三：将 a.txt 传输到 input 上

[hadoop@master ~]$ hadoop fs -put ~/a.txt /input

2.4. 步骤四：进入到 jar 包测试文件目录下

[hadoop@master ~]$ cd /usr/local/src/hadoop/share/hadoop/mapreduce/

2.5. 步骤五：测试 mapreduce

[hadoop@master mapreduce]$ hadoop jar hadoop-mapreduce-examples-2.7.1.jar
wordcount /input/wbb.txt /output
23/05/30 07:08:46 INFO input.FileInputFormat: Total input paths to process : 1
23/05/30 07:08:46 INFO mapreduce.JobSubmitter: number of splits:1
23/05/30 07:08:46 INFO mapreduce.JobSubmitter: Submitting tokens for job:
job_1685444184808_0001
23/05/30 07:08:47 INFO impl.YarnClientImpl: Submitted application
application_1685444184808_0001
23/05/30 07:08:47 INFO mapreduce.Job: The url to track the job:
http://master:8088/proxy/application_1685444184808_0001/
23/05/30 07:08:47 INFO mapreduce.Job: Running job: job_1685444184808_0001
23/05/30 07:08:59 INFO mapreduce.Job: Job job_1685444184808_0001 running in uber
mode : false
23/05/30 07:08:59 INFO mapreduce.Job: map 0% reduce 0%
23/05/30 07:09:07 INFO mapreduce.Job: map 100% reduce 0%
23/05/30 07:09:11 INFO mapreduce.Job: map 100% reduce 100%
23/05/30 07:09:12 INFO mapreduce.Job: Job job_1685444184808_0001 completed
successfully
23/05/30 07:09:12 INFO mapreduce.Job: Counters: 49
File System Counters
FILE: Number of bytes read=43
FILE: Number of bytes written=236319
FILE: Number of read operations=0
FILE: Number of large read operations=0
FILE: Number of write operations=0
HDFS: Number of bytes read=120
HDFS: Number of bytes written=25
HDFS: Number of read operations=6
HDFS: Number of large read operations=0
HDFS: Number of write operations=2
Job Counters
Launched map tasks=1
Launched reduce tasks=1
Data-local map tasks=1
Total time spent by all maps in occupied slots (ms)=6390
Total time spent by all reduces in occupied slots (ms)=1593
Total time spent by all map tasks (ms)=6390
Total time spent by all reduce tasks (ms)=1593
Total vcore-seconds taken by all map tasks=6390
Total vcore-seconds taken by all reduce tasks=1593
Total megabyte-seconds taken by all map tasks=6543360
Total megabyte-seconds taken by all reduce tasks=1631232
Map-Reduce Framework
Map input records=2
Map output records=4
Map output bytes=41
Map output materialized bytes=43
Input split bytes=95
Combine input records=4
Combine output records=3
Reduce input groups=3
高可用性验证
Reduce shuffle bytes=43
Reduce input records=3
Reduce output records=3
Spilled Records=6
Shuffled Maps =1
Failed Shuffles=0
Merged Map outputs=1
GC time elapsed (ms)=404
CPU time spent (ms)=2500
Physical memory (bytes) snapshot=433823744
Virtual memory (bytes) snapshot=4241760256
Total committed heap usage (bytes)=283115520
Shuffle Errors
BAD_ID=0
CONNECTION=0
IO_ERROR=0
WRONG_LENGTH=0
WRONG_MAP=0
WRONG_REDUCE=0
File Input Format Counters
Bytes Read=25
File Output Format Counters
Bytes Written=25

2.7. 步骤七：查看文件测试的结果

[hadoop@master mapreduce]$ hadoop fs -cat /output/part-r-00000
Hadoop 1
Hello 2
World 1

3. 实验任务三：高可用性验证

3.1. 步骤一：:自动切换服务状态

[hadoop@master ~]$ hdfs haadmin -getServiceState slave1
active
[hadoop@master ~]$ hdfs haadmin -getServiceState master
standby

3.2. 步骤二：手动切换服务状态

[hadoop@slave1 ~]$ hadoop-daemon.sh stop namenode
stopping namenode
[hadoop@master ~]$  hdfs haadmin -getServiceState master
active
[hadoop@master ~]$ hdfs haadmin -getServiceState slave1
23/05/30 23:35:24 INFO ipc.Client: Retrying connect to server: slave1/192.168.100.20:8020. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=1, sleepTime=1000 MILLISECONDS)
Operation failed: Call From master/192.168.100.10 to slave1:8020 failed on connection exception: java.net.ConnectException: Connection refused; For more details see:  http://wiki.apache.org/hadoop/ConnectionRefused

查看 web 服务端

master:50070

slave1:50070

标签：src,进阶,root,ZooKeeper,hadoop,集群,usr,master,local
From： https://www.cnblogs.com/shuangmu668/p/17533034.html

高可用 ZooKeeper 集群部署（进阶中级）

高可用 ZooKeeper 集群部署（进阶中级）

免密登录

1. 实验任务一：ZooKeeper 安装部署

1.1. 步骤一：安装 ZooKeeper

1.2.步骤二：创建 ZooKeeper 数据目录

2.实验任务二：ZooKeeper 文件参数配置

2.1. 步骤一：配置 ZooKeeper 环境变量

2.2. 步骤二：修改 zoo.cfg 配置文件

2.3. 步骤三：创建 myid 配置文件

3. 实验任务三：ZooKeeper 集群启动

3.1. 步骤一：分发 ZooKeeper 集群

3.2. 步骤二：修改 myid 配置

3.3. 步骤三：修改 ZooKeeper 安装目录的归属用户为 hadoop 用户。

3.4. 步骤四：启动 ZooKeeper 集群

2. 实验二 Hadoop HA 集群部署

1.实验任务一：Hadoop HA 文件参数配置

1.1. 步骤一：解压安装 Hadoop

1.2步骤二：更改 hadoop 文件名

1.3. 步骤三：配置 hadoop 环境变量

1.4.步骤四：配置 hadoop-env.sh 配置文件

1.5. 步骤五：配置 core-site.xml 配置文件

1.6. 步骤六：配置 hdfs-site.xml 配置文件

1.7. 步骤七：配置 mapred-site.xml 配置文件

1.8. 步骤八：配置 yarn-site.xml 配置文件

1.9. 步骤九：配置 slaves 配置文件

1.10. 步骤十：解压包到指定目录

1.11. 步骤十一：分发文件

1.12. 步骤十二：修改目录所有者和所有者组

实验一：高可用集群启动

实验任务一：HA 的启动

1.1. 步骤一：启动 journalnode 守护进程

1.2. 步骤二：初始化 namenode

1.3. 步骤三：注册 ZNode

1.5. 步骤五：启动 yarn

1.6. 步骤六：同步 master 数据

复制 namenode 元数据到其它节点(在 master 节点执行)

1.7. 步骤七：在 slave1 上启动 resourcemanager 和 namenode 进程

1.8. 步骤九：启动 MapReduce 任务历史服务器

1.9. 步骤十：查看端口和进程

2.实验任务二：HA 的测试

2.1. 步骤一：创建一个测试文件

.2.2. 步骤二：在 hdfs 创建文件夹

.2.3. 步骤三：将 a.txt 传输到 input 上

2.4. 步骤四：进入到 jar 包测试文件目录下

2.5. 步骤五：测试 mapreduce

2.7. 步骤七：查看文件测试的结果

3. 实验任务三：高可用性验证

3.1. 步骤一：:自动切换服务状态

3.2. 步骤二：手动切换服务状态

查看 web 服务端

master:50070

slave1:50070

相关文章

赞助商

阅读排行