首页 > 其他分享 >Hadoop集群模式的搭建之二:配置Hadoop平台基础环境

Hadoop集群模式的搭建之二:配置Hadoop平台基础环境

时间:2024-04-27 19:11:49浏览次数:36  
标签:1.4 Hadoop 之二 slave1 master slave2 集群 节点

在进行Hadoop集群的安装部署之前,需要对虚拟机进行一些基础环境配置。例如,为了在集群中识别主机,需要配置主机和IP地址的映射关系;为了使用Web相关的服务和访问连接,需要在集群中关闭并禁用防火墙功能;为了减少节点之间访问时人工输入用户密码,需要配置SSH免密登录;为了集群节点的时间能同步,需要配置时间服务。

1.1 设置服务器的主机名

Hadoop集群的3个节点的主机名分别为master、slave1、slave2

  • 修改master节点的主机名
    在master节点中执行修改命令hostnamectl set-hostname master,然后执行 bash 命令刷新主机名

  • 修改slave1节点的主机名
    在slave1节点中执行修改命令hostnamectl set-hostname slave1,然后执行 bash 命令刷新主机名

  • 修改slave2节点的主机名
    在slave2节点中执行修改命令hostnamectl set-hostname slave2,然后执行 bash 命令刷新主机名

1.2 关闭并禁用防火墙

Hadoop集群可以在web页面中进行管理,但需要关闭防火墙,否则会打不开web页面,也会造成Hadoop后台运行脚本出现一些不好解决的、莫名的错误
在master,slave1,slave2节点中分别关闭并禁用防火墙,并查看防火墙状态
关闭防火墙命令:systemctl stop firewalld;禁用防火墙命令:systemctl disable firewalld;查看防火墙状态:systemctl status firewalld

1.3 修改主机IP地址映射文件

1.3.1 修改虚拟机节点的主机IP地址映射文件

在master、slave1、slave2节点分别执行命令vi /etc/hosts 编辑hosts文件,文件内容为

192.168.75.151 master
192.168.75.152 slave1
192.168.75.153 slave2

1.3.2 修改宿主机的主机IP地址映射文件

在宿主机windows操作系统中,进入 C:\Windows\System32\Drivers\etc 目录,修改host文件,在文件末尾追加以下信息

192.168.75.151 master
192.168.75.152 slave1
192.168.75.153 slave2

1.4 配置免密登录

集群节点之间因为各种需要,会互相访问,如在节点之间执行scp命令发送文件,或者在一键启动Hadoop集群时,默认情况下需要手动输入很多次密码,所以在集群节点之间设置相互SSH免密登录会比较方便

1.4.1 在3个节点上生成密钥对

在3个节点上分别执行 "sgensh-keygen -t rsa -P '' "命令,在交互过程中会提示密钥对存放路径,默认存放在/root/.ssh/id_rsa目录下,直接按回车键选择存放在该目录下。

1.4.2 在master节点上收集slave1节点的公钥

执行切换目录命令cd /root/.ssh/
执行传输命令 scp root@slave1:~/.ssh/id_ras.pub ./1.pub

1.4.2 在master节点上收集slave2节点的公钥

执行切换目录命令cd /root/.ssh/
执行传输命令 scp root@slave2:~/.ssh/id_ras.pub ./2.pub

1.4.3 在master节点上制作白名单

执行切换目录命令cd /root/.ssh/
执行制作和赋权白名单命令
cat id_ras.pub 1.pub 2.pub >> authorized_keys
chmod 700 authorized_keys
cat authorized_keys

1.4.4 将白名单文件分发给其他节点

需要将白名单文件分发到slave1节点和slave2节点上才能互相拥有对方的公钥,实现SSH免密登录。执行以下命令将白名单文件分发给slave1节点和slave2节点

scp /root/.ssh/authorized_keys slave1:/root/.ssh/
scp /root/.ssh/authorized_keys slave2:/root/.ssh/

1.4.5 设置集群时间同步

集群中的节点如果没有连接外网,则时间久了,会产生时间偏差,导致集群执行任务时间不同步,所以需要在集群中的节点上设置服务器集群的时间同步。

1.4.5.1 安装并启动NTP服务

如果系统默认没有安装NTP服务,则需要先安装,分别在3个节点上执行以下命令,
安装NTP服务

yum install -y ntpdate
yum install -y ntp

启动NTP服务

systemctl start ntpd
systemctl enable ntpd

1.4.5.2 设置时间同步服务器

在master节点上修改ntp.conf文件,执行vi /etc/ntp.conf命令,在public server章节下添加"server 127.127.1.0"内容,表示设置服务器为本地节点;在access章节下添加"restrict 192.168.75.0",表示新增一个restrict段为可以接受服务的网段

重启NTP 服务

systemctl restart ntpd
systemctl status ntpd

1.4.5.3 设置时间同步客户端

设置slave1节点和slave2节点作为时间同步客户端来同步master服务器的时间,在slave1和slave2节点执行vi /etc/ntp.conf命令,修改ntp.conf文件,在server节点中添加一个时间同步服务器地址,这里为"192.168.75.151"

1.4.5.3 在所有节点上启动时间同步功能

执行命令timedatectl set-ntp yes

标签:1.4,Hadoop,之二,slave1,master,slave2,集群,节点
From: https://www.cnblogs.com/cs-js/p/18162369

相关文章

  • 搭建单机版伪分布式Hadoop+Scala+spark
    搭建单机版伪分布式Hadoop+Scala+spark修改ip[root@master~]#nmcliconnectionaddifnameens32con-nameens32autoconnectyesipv4.methodmanualipv4.gateway192.168.130.2ipv4.addresses192.168.130.102/24ipv4.dns114.114.114.114[root@master~]#nmcliconu......
  • nginx高性能负载均衡集群
    高性能负载均衡集群一、集群是什么简单地说,集群就是指一组(若干个)相互独立的计算机,利用高速通信网络组成的一个较大的计算机服务系统,每个集群节点(即集群中的每台计算机)都是运行各自服务的独立服务器。这些服务器之间可以彼此通信,协同向用户提供应用程序,系统资源和数据,并以单一......
  • 大数据平台搭建手册——hadoop
    从0开始超详细搭建hadoop平台手册创建三台使用centos7操作系统的虚拟机基础环境配置ps:不建议使用DHCP,因为ip地址会变动配置ip1.master[root@master~]#nmcliconnectionaddifnameens32con-nameens32autoconnectyestypeethernetipv4.methodmanualipv4.add......
  • etcd集群节点扩容【二进制】
    1、更新etcd集群证书信息#生成新证书cfsslgencert-initcaca-csr.json|cfssljson-bareca-cfsslgencert-ca=ca.pem-ca-key=ca-key.pem-config=ca-config.json-profile=wwwserver-csr.json|cfssljson-bareserver2、拷贝证书到旧节点和新节点#旧节点cp~/TLS/e......
  • SpringCloud(十一)ES 进阶 -- ES集群
    单机的elasticsearch做数据存储,必然面临两个问题:海量数据存储问题、单点故障问题。解决方案:海量数据存储问题:将索引库从逻辑上拆分为N个分片,存储到多个节点。单点故障问题:将分片数据在不同节点备份。(这样有一个点挂掉,还能保证数据是完整的,如图:比如说node1挂掉了,node1的主数据sh......
  • Redis部署集群、高可用
    1.Redis部署1.1解压redis安装包[root@mongo1~]#tar-zxvfredis-5.0.14.tar.gz-C/usr/local/redis-5.0.14/redis-5.0.14/.gitignoreredis-5.0.14/00-RELEASENOTESredis-5.0.14/BUGSredis-5.0.14/CONTRIBUTINGredis-5.0.14/COPYINGredis-5.0.14/INSTALLredis-5.0.14/......
  • K8S集群问题:案例一:Java调用Glibc2.28-69内存分配器无法限制虚拟内存VIRT问题
    一、问题描述1、背景:租户反馈,Apr711:22容器出现夯死现象,容器部署的单个java进程;宿主机上,top显示的容器进程virt内存持续增长32G,目前messages日志没有看到oom的记录,基本是。租户其他bc7、8系统上有添加参数MALLOC_ARENA_MAX进行限制,基本维持在16G左右,目前bcoe21.10系统配置......
  • 在虚拟机环境下搭建MPI集群
    一、安装虚拟机这步就不详细说了,参考了一位博主的教程,推荐:安装CentOS7虚拟机(超详细)_linux多台虚拟机-CSDN博客这步踩了一个坑,报错显示无法使用内核设备,参考博文:无法打开内核设备“\.\VMCIDev\VMX”:操作成功完成。是否在安装VMwareWorkstation后重新引导?模块“DevicePower......
  • 告别手动调度,海豚调度器 3.1.x 集群部署让你轻松管理多机!
    转载自第一片心意1前言由于海豚调度器官网的集群部署文档写的较乱,安装过程中需要跳转到很多地方进行操作,所以自己总结了一篇可以直接跟着从头到尾进行操作的文档,以方便后续的部署、升级、新增节点、减少节点的相关操作。2.提前准备2.1.基础组件JDK:下载JDK(1.8+),安装并......
  • 使用Docker搭建MongoDB 5.0版本副本集集群
    1、mongodb集群首先我们需要了解mongodb的集群模式,mongodb安装分为单机安装和集群安装。集群安装分为:主从复制(Master-Slaver)集群、副本集(ReplicaSet)集群和分片集群(ShardedCluster)。MongoDB的主从复制(Master-SlaveReplication)已不再是官方推荐的特性,并且在未来的版本中可能会被......