首页 > 其他分享 >hadoop-3.3.0集群环境搭建

hadoop-3.3.0集群环境搭建

时间:2023-03-21 18:02:59浏览次数:39  
标签:root hadoop master usr 集群 local 3.3


# 1. 配置三台机器的IP地址

master 10.43.80.80
slave1 10.43.80.81
slave2 10.43.80.82

# 2. 关闭三台机器防火墙
systemctl stop firewalld.service

# 3. 修改主机名
对应IP地址,修改对应的主机名
master 10.43.80.80
slave1 10.43.80.81
slave2 10.43.80.82

执行命令
hostnamectl set-hostname master
hostnamectl set-hostname slave1
hostnamectl set-hostname slave2


# 4. 增加IP和主机名的映射关系
vi /etc/hosts

10.43.80.80 master
10.43.80.81 slave1
10.43.80.82 slave2

# 5. 重启服务器使得配置生效
reboot
# 1. 安装jdk
此处省略.....

# 2. 安装hadoop
下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/

上传至master服务器,解压项目
cd /usr/local/tools
tar -zxvf hadoop-3.3.0.tar.gz

# 3. 配置环境变量
vim /etc/profile
export HADOOP_HOME=/usr/local/tools/hadoop-3.3.0
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile
hadoop version

# 4. 设置配置文件
cd /usr/local/tools/hadoop-3.3.0/etc/hadoop

4.1. 文件:workers (之前文件名称叫做slave)
vi workers

# localhost
slave1
slave2

4.2. 文件:core-site.xml
vi core-site.xml

<configuration>
<!-- 指定临时文件目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/tools/hadoop-3.3.0/tmp/</value>
</property>
<!-- 配置HDFS的NameNode所在节点服务器 -->
<property>
<name>fs.default.name</name>
<value>hdfs://10.43.80.80:9000</value>
</property>
</configuration>

cd /usr/local/tools/hadoop-3.3.0
mkdir tmp

4.3. 文件:hdfs-site.xml
vi hdfs-site.xml

<configuration>
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<!-- 指定Hadoop辅助名称节点主机配置 -->
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>10.43.80.80:50090</value>
</property>
<!-- namenode节点数据保存的位置 -->
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/tools/hadoop-3.3.0/tmp/dfs/name</value>
</property>
<!-- datanode节点数据保存的位置 -->
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/tools/hadoop-3.3.0/tmp/dfs/data</value>
</property>
</configuration>

4.4. 文件:mapred-site.xml
vi mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>10.43.80.80:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>10.43.80.80:19888</value>
</property>
</configuration>

4.5. 文件:yarn-site.xml
vi yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

5. 配置jdk环境
在hadoop-env.sh启动脚本中,添加jdk路径
vi /usr/local/tools/hadoop-3.3.0/etc/hadoop/hadoop-env.sh
export JAVA_HOME=/usr/local/tools/jdk-11.0.12

6. 修改脚本用户信息
cd /usr/local/tools/hadoop-3.3.0/sbin

6.1. 在start-dfs.sh和stop-dfs.sh脚本中添加如下信息
HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
6.2. 在start-yarn.sh和stop-yarn.sh脚本中添加如下信息
YARN_RESOURCEMANAGER_USER=root
HDFS_DATANODE_SECURE_USER=yarn
YARN_NODEMANAGER_USER=root


7. 同步部署包
将master上面设置好的项目包hadoop-3.3.0同步至slave1和slave2

scp -rp /usr/local/hadoop slave1:/usr/local/hadoop
scp -rp /usr/local/hadoop slave2:/usr/local/hadoop
# 1. ssh免密登录

1.1. 三台机器分别生成公钥
cd ~

ssh-keygen
回车
回车
回车


1.2. 集成三台服务器公钥,并分发 (在master操作)
将其他两台的公钥拷贝到authorized_keys中,效果如下所示
cp id_rsa.pub ~/.ssh/authorized_keys
vi authorized_keys
xxxxx root@master
xxxxx root@slave1
xxxxx root@slave2

分发文件
scp -rp authorized_keys slave1:~/.ssh/
scp -rp authorized_keys slave2:~/.ssh/


1.3. 验证
[root@master ~]# ssh slave2
Last login: Tue Sep 7 06:55:59 2021 from slave1
[root@slave2 ~]# ssh master
Last login: Mon Sep 6 22:56:56 2021 from slave1
[root@master ~]# ssh slave1
Last login: Tue Sep 7 06:56:51 2021 from master
# 1. 初始化 (在master执行,只执行一次,slave不需要执行)
hdfs namenode -format


# 2. 启动hadoop (在master执行命令)
./start-dfs.sh
./start-yarn.sh

效果如下所示
[root@master sbin]# jps
100995 NameNode
101827 Jps
101222 SecondaryNameNode
101480 ResourceManager

[root@slave1 hadoop-3.3.0]# jps
3204 Jps
3048 DataNode
3144 NodeManager

[root@slave2 hadoop-3.3.0]# jps
2754 DataNode
2850 NodeManager
2910 Jps

标签:root,hadoop,master,usr,集群,local,3.3
From: https://blog.51cto.com/u_16021118/6140750

相关文章

  • mysql集群搭建docker-compose方案
    MySQL集群搭建大致有两种方式,一种是单主/多从的主从复制方式,另一种是使用GaleraCluster高可用解决方案。1、步骤以下我们详细介绍一下单主/多从的主从复制方式:确认服......
  • kubernetes 集群环境搭建 (kubeadm方式)
    1、前置知识点目前生产部署Kubernetes集群主要有两种方式:(1)kubeadmKubeadm是一个K8s部署工具,提供kubeadminit和kubeadmjoin,用于快速部署Kubernetes集群。官方地......
  • 2023.3.19周报
    本周总结:刷了洛谷一些动态规划蓝题紫题大方向:动态规划小专题:树型DP、区间DP题目完成情况:15 ......
  • 谷歌云| 5 个 GKE 功能可帮助您优化集群
    本文将讨论GKE中的5个功能,您现在可以使用这些功能来优化您的集群。要开始在GKE中测试这些,请查看交互式教程以开始使用标准和自动驾驶仪集群。如果您从组织中的Kuber......
  • 谷歌云技术必看! 5 个 GKE 功能可帮助您优化集群
     【CloudAce是谷歌云全球战略合作伙伴,拥有300多名工程师,也是谷歌最高级别合作伙伴,多次获得GoogleCloud合作伙伴奖。作为谷歌托管服务商,提供谷歌云、谷歌地图、谷......
  • Kubernetes 学习总结(19)—— Kubernetes 集群管理平台如何选择?Rancher vs KubeSphere
    Kubernetes学习总结(19)——Kubernetes集群管理平台如何选择?RanchervsKubeSphere 前言Kubernetes(K8s)集群管理平台都是基于Kubernetes提供功能,可以说他们是在K8s......
  • Dubbo——集群(Cluster)容错原理
    摘要集群中的单个节点有一定概率出现一些问题,例如,磁盘损坏、系统崩溃等,导致节点无法对外提供服务,因此在分布式RPC框架中,必须要重视这种情况。为了避免单点故障,我们的Prov......
  • 闲话 23.3.20
    闲话今日闲话【碎片】(0.8/1)杂题P9157令积性函数\(f\)满足\(f(p^c)=p^{\gcd(c,k)}\),其中\(k\)为给定常数,\(p\)为素数,\(c\)为正整数。给定\(n,m,k\),请求出\[......
  • macOS 13.3 Beta 4 (22E5246b)With OpenCore 0.9.1开发版 and winPE双引导分区原版镜像
    镜像特点完全由黑果魏叔官方制作,针对各种机型进行默认配置,让黑苹果安装不再困难。系统镜像设置为双引导分区,全面去除clover引导分区(如有需要,可以自行直接替换opencore分区文......
  • centos7通过CDH部署Hadoop
    一、角色分配及安装环境准备资料下载地址:链接:百度网盘1.机器及机器角色规划2.关闭防火墙及SELinux3.安装依赖(server)yuminstall-ycyrus-sasl-plaincyrus-sa......