首页 > 系统相关 >centos7上Hadoop2.7.2完全分布式部署

centos7上Hadoop2.7.2完全分布式部署

时间:2023-05-28 19:25:34浏览次数:46  
标签:node2 hadoop centos7 etc node1 node3 Hadoop2.7 root 分布式

1.规划

node1                  node2                      node3
datanode             datanode                 datanode
namenode          resourcemanager    secondarynamenode
nodemanager     nodemanager         nodemanager

2.设置环境

2.1 修改hostname主机名  注:分别在三台机器上执行下列命令  设置主机名

hostnamectl set-hostname node1

hostnamectl set-hostname node2

hostnamectl set-hostname node3

  

 

2.2 关闭防火墙     注:在三台机器上均需要执行

 systemctl stop firewalld
 systemctl disable firewalld

2.3 关闭selinux    注:在三台机器上均需要执行

vim /etc/selinux/config
SELINUX=disabled

#setenforce 0

2.4 创建hadoop用户    注:在三台机器上均需要执行

useradd -d /hadoop hadoop
echo 123|passwd --stdin hadoop

2.5 修改/etc/hosts     注:在三台机器上均需要执行

[root@node1 ~]# vim /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.100.10 node1
192.168.100.11 node2
192.168.100.12 node3

2.6 修改sudo配置文件    注:在三台机器上均需要执行

vim /etc/sudoers
## Allow root to run any commands anywhere 
root    ALL=(ALL)       ALL
hadoop  ALL=(ALL)       ALL

2.7  配置免密登录   注:在三台机器上均需要执行下列命令

[root@node1 ~]# ssh-keygen -t rsa   ##三次回车   创建密钥

[root@node1 ~]# ssh-copy-id hadoop@node1  ##同步当前主机公钥到node1

[root@node1 ~]# ssh-copy-id hadoop@node2  ##同步当前主机公钥到node2
[root@node1 ~]# ssh-copy-id hadoop@node3  ##同步当前主机公钥到node3

2.8 安装jdk    注:在三台机器上均需要执行下列命令

[root@node1 soft]# rpm -ivh jdk-8u371-linux-x64.rpm 

 

3 安装hadoop-2.7.2 注:只在node1上执行,使用Hadoop用户执行命令

3.1 解压安装包

tar -zxf hadoop-2.7.2.tar.gz -C /hadoop/ 
ln -s /hadoop/hadoop-2.7.2 /hadoop/hadoop

3.2 修改Hadoop配置文件

cd hadoo/hadoop/etc/hadoop/
vim core-site.xml
  <property>
    <name>fs.defaultFS</name>
        <value>hdfs://node1:9000</value>
  </property>

  <property>


vim hdfs-site.xml 
  <property>
    <name>dfs.replication</name>
        <value>1</value>
  </property>

  <property>
    <name>dfs.namenode.secondary.http-address</name>
        <value>node3</value>
  </property>

vim yarn-site.xml 
  <property>
    <name>yarn.resourcemanager.hostname</name>
        <value>node2</value>
  </property>

  <property>
    <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
  </property>

vim mapred-site.xml
        <property>
          <name>mapreduce.framework.name</name>
          <value>yarn</value>
        </property>

3.3 修改 /etc/profile

sudo vim /etc/profile
export JAVA_HOME=/usr/lib/jvm/jdk-1.8-oracle-x64
export HADOOP_HOME=/hadoop/hadoop
export PATH=$PATH:$JAVA_HOME:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

3.4 同步hadoop安装包

-bash-4.2$ pwd
/hadoop
-bash-4.2$ scp -r hadoop-2.7.2 hadoop@node2:/hadoop

-bash-4.2$ scp -r hadoop-2.7.2 hadoop@node3:/hadoop


su - root scp -r /etc/profile root@node2:/etc/profile scp -r /etc/profile root@node3:/etc/profile

3.5 使用Hadoop用户在node2、node3上执行下列命令  注:设置软连接 有利于以后的版本升级

cd /hadoop
ln -s hadoop-2.7.2 hadoop

4 启动hadoop

##在node1上使用hadoop用户执行
start-all.sh

  

  

 

标签:node2,hadoop,centos7,etc,node1,node3,Hadoop2.7,root,分布式
From: https://www.cnblogs.com/hxy0001/p/17438676.html

相关文章

  • centos7.9上hadoop-2.7.2伪分布式部署
    1.安装jdk1.1在Oracle官网上现在jdk1.8,然后上传到Linux服务器中1.2 安装jdk rpm-ivhjdk-8u371-linux-x64.rpm2创建部署用户hadoopuseradd-d/hadoophadoopecho123|passwd--stdinhadoop3修改/etc/hosts4使用Hadoop用户上传hadoop安装包hadoop-2.7......
  • 使用Python实现分布式爬虫
    使用Python实现分布式爬虫在Web爬虫中,分布式爬虫已经成为一种流行的技术,可以帮助我们快速地收集互联网上的数据。下面我们将介绍如何使用Python实现分布式爬虫。什么是分布式爬虫?分布式爬虫是指将爬虫任务分配给多个计算机节点执行,以提高爬取效率和稳定性的一种技术。分布式爬虫通......
  • Centos7.6 ipmi驱动报错解决
    现象描述如上图,找不到这个设备的信息,dmesg中也提示没有此设备排查过程1.在内核代码内进行追踪,发现dmi_find_device时未找到设备2.而且使用dmidecode命令时发现错误:WrongDMIstructureslength:1104bytesannounced,only32bytesavailable.Invalidentrylength(0).DMIta......
  • 分布式事务
    AT:AT模式是一种无侵入的分布式事务解决方案。阿里seata框架,实现了该模式TCC:TCC模式需要用户根据自己的业务场景实现Try、Confirm和Cancel三个操作;事务发起方在一阶段执行Try方式,在二阶段提交执行Confirm方法,二阶段回滚执行Cancel方法。TCC三个方法描述:Try:资源的检测......
  • 分布式机器学习(Parameter Server)
    分布式机器学习中,参数服务器(ParameterServer)用于管理和共享模型参数,其基本思想是将模型参数存储在一个或多个中央服务器上,并通过网络将这些参数共享给参与训练的各个计算节点。每个计算节点可以从参数服务器中获取当前模型参数,并将计算结果返回给参数服务器进行更新。为了保持......
  • 分布式CAP理论
    分布式:一个大业务拆分成多个小业务并部署在不同的服务器上CAP:一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partitiontolerance)这三项中的两项。  网络问题不可避免,P(分区容错性)是一定需要保证的如果此时有节点故障,如果剩余节点正常......
  • centos7.6 终端显示乱码解决只要一步
    解释一下乱码原因,服务器编码和终端工具不一致。但只要支持utf-8,不管终端工具和服务器怎么编码都可以正确显示。所以先看终端工具是不是utf-8,我的终端工具显示如下,是UTF-8 再检查服务器编码,使用命令locale看服务器编码,或者用echo$LANG明显没有UTF-8字样。那就修改服务......
  • 分布式基础之CAP理论&BASE理论
    1.CAP理论1.1)含义C(Consistency一致性)、Availability(可用性)、PartitionTolerance(分区容错性)。1.2)具体意义一致性(Consistency):所有节点访问同一份最新的数据副本可用性(Availability):非故障的节点在合理的时间内返回合理的响应(不是错误或者超时的响应)。分区容错性(Partition......
  • 配置GlusterFS分布式文件系统​
    拓扑图:推荐步骤:在Centos01到Centos04,在每台服务器创建四个分区格式化为XFS文件系统自动设置开机自动挂载在Centos01到Centos04安装glusterFS分布式存储系统创建配置glusterfs群集和创建分布式条带卷、分布式复制卷、分布式卷、条带卷实验步骤:一.在Centos01到Centos04,在每台服务器创......
  • 分布式事务的21种武器 - 6
    在分布式系统中,事务的处理分布在不同组件、服务中,因此分布式事务的ACID保障面临着一些特殊难点。本系列文章介绍了21种分布式事务设计模式,并分析其实现原理和优缺点,在面对具体分布式事务问题时,可以选择合适的模式进行处理。原文:ExploringSolutionsforDistributedTransactio......