centos7上Hadoop2.7.2完全分布式部署

时间：2023-05-28 19:25:34浏览次数：55

标签：node2 hadoop centos7 etc node1 node3 Hadoop2.7 root 分布式

1.规划

node1 node2 node3
datanode datanode datanode
namenode resourcemanager secondarynamenode
nodemanager nodemanager nodemanager

2.设置环境

2.1 修改hostname主机名注：分别在三台机器上执行下列命令设置主机名

hostnamectl set-hostname node1

hostnamectl set-hostname node2

hostnamectl set-hostname node3

2.2 关闭防火墙注：在三台机器上均需要执行

 systemctl stop firewalld
 systemctl disable firewalld

2.3 关闭selinux 注：在三台机器上均需要执行

vim /etc/selinux/config
SELINUX=disabled

#setenforce 0

2.4 创建hadoop用户注：在三台机器上均需要执行

useradd -d /hadoop hadoop
echo 123|passwd --stdin hadoop

2.5 修改/etc/hosts 注：在三台机器上均需要执行

[root@node1 ~]# vim /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.100.10 node1
192.168.100.11 node2
192.168.100.12 node3

2.6 修改sudo配置文件注：在三台机器上均需要执行

vim /etc/sudoers
## Allow root to run any commands anywhere 
root    ALL=(ALL)       ALL
hadoop  ALL=(ALL)       ALL

2.7 配置免密登录注：在三台机器上均需要执行下列命令

[root@node1 ~]# ssh-keygen -t rsa   ##三次回车   创建密钥

[root@node1 ~]# ssh-copy-id hadoop@node1  ##同步当前主机公钥到node1

[root@node1 ~]# ssh-copy-id hadoop@node2  ##同步当前主机公钥到node2

[root@node1 ~]# ssh-copy-id hadoop@node3  ##同步当前主机公钥到node3

2.8 安装jdk 注：在三台机器上均需要执行下列命令

[root@node1 soft]# rpm -ivh jdk-8u371-linux-x64.rpm

3 安装hadoop-2.7.2 注：只在node1上执行，使用Hadoop用户执行命令

3.1 解压安装包

tar -zxf hadoop-2.7.2.tar.gz -C /hadoop/ 
ln -s /hadoop/hadoop-2.7.2  /hadoop/hadoop

3.2 修改Hadoop配置文件

cd hadoo/hadoop/etc/hadoop/
vim core-site.xml
  <property>
    <name>fs.defaultFS</name>
        <value>hdfs://node1:9000</value>
  </property>

  <property>


vim hdfs-site.xml 
  <property>
    <name>dfs.replication</name>
        <value>1</value>
  </property>

  <property>
    <name>dfs.namenode.secondary.http-address</name>
        <value>node3</value>
  </property>

vim yarn-site.xml 
  <property>
    <name>yarn.resourcemanager.hostname</name>
        <value>node2</value>
  </property>

  <property>
    <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
  </property>

vim mapred-site.xml
        <property>
          <name>mapreduce.framework.name</name>
          <value>yarn</value>
        </property>

3.3 修改 /etc/profile

sudo vim /etc/profile
export JAVA_HOME=/usr/lib/jvm/jdk-1.8-oracle-x64
export HADOOP_HOME=/hadoop/hadoop

export PATH=$PATH:$JAVA_HOME:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

3.4 同步hadoop安装包

-bash-4.2$ pwd
/hadoop
-bash-4.2$ scp -r hadoop-2.7.2 hadoop@node2:/hadoop

-bash-4.2$ scp -r hadoop-2.7.2 hadoop@node3:/hadoop


su - root
scp -r /etc/profile root@node2:/etc/profile

scp -r /etc/profile root@node3:/etc/profile

3.5 使用Hadoop用户在node2、node3上执行下列命令注：设置软连接有利于以后的版本升级

cd /hadoop
ln -s hadoop-2.7.2 hadoop

4 启动hadoop

##在node1上使用hadoop用户执行
start-all.sh

标签：node2,hadoop,centos7,etc,node1,node3,Hadoop2.7,root,分布式
From： https://www.cnblogs.com/hxy0001/p/17438676.html

centos7.9上hadoop-2.7.2伪分布式部署
1.安装jdk1.1在Oracle官网上现在jdk1.8，然后上传到Linux服务器中1.2 安装jdk rpm-ivhjdk-8u371-linux-x64.rpm2创建部署用户hadoopuseradd-d/hadoophadoopecho123|passwd--stdinhadoop3修改/etc/hosts4使用Hadoop用户上传hadoop安装包hadoop-2.7......
使用Python实现分布式爬虫
使用Python实现分布式爬虫在Web爬虫中，分布式爬虫已经成为一种流行的技术，可以帮助我们快速地收集互联网上的数据。下面我们将介绍如何使用Python实现分布式爬虫。什么是分布式爬虫？分布式爬虫是指将爬虫任务分配给多个计算机节点执行，以提高爬取效率和稳定性的一种技术。分布式爬虫通......
Centos7.6 ipmi驱动报错解决
现象描述如上图，找不到这个设备的信息，dmesg中也提示没有此设备排查过程1.在内核代码内进行追踪，发现dmi_find_device时未找到设备2.而且使用dmidecode命令时发现错误:WrongDMIstructureslength:1104bytesannounced,only32bytesavailable.Invalidentrylength(0).DMIta......
分布式事务
AT：AT模式是一种无侵入的分布式事务解决方案。阿里seata框架，实现了该模式TCC：TCC模式需要用户根据自己的业务场景实现Try、Confirm和Cancel三个操作；事务发起方在一阶段执行Try方式，在二阶段提交执行Confirm方法，二阶段回滚执行Cancel方法。TCC三个方法描述：Try：资源的检测......
分布式机器学习(Parameter Server)
分布式机器学习中，参数服务器(ParameterServer)用于管理和共享模型参数，其基本思想是将模型参数存储在一个或多个中央服务器上，并通过网络将这些参数共享给参与训练的各个计算节点。每个计算节点可以从参数服务器中获取当前模型参数，并将计算结果返回给参数服务器进行更新。为了保持......
分布式CAP理论
分布式：一个大业务拆分成多个小业务并部署在不同的服务器上CAP：一个分布式系统最多只能同时满足一致性（Consistency）、可用性（Availability）和分区容错性（Partitiontolerance）这三项中的两项。网络问题不可避免，P（分区容错性）是一定需要保证的如果此时有节点故障，如果剩余节点正常......
centos7.6 终端显示乱码解决只要一步
解释一下乱码原因，服务器编码和终端工具不一致。但只要支持utf-8，不管终端工具和服务器怎么编码都可以正确显示。所以先看终端工具是不是utf-8,我的终端工具显示如下，是UTF-8 再检查服务器编码，使用命令locale看服务器编码，或者用echo$LANG明显没有UTF-8字样。那就修改服务......
分布式基础之CAP理论&BASE理论
1.CAP理论1.1）含义C（Consistency一致性）、Availability（可用性）、PartitionTolerance（分区容错性）。1.2）具体意义一致性（Consistency）:所有节点访问同一份最新的数据副本可用性（Availability）:非故障的节点在合理的时间内返回合理的响应（不是错误或者超时的响应）。分区容错性（Partition......
配置GlusterFS分布式文件系统
拓扑图：推荐步骤：在Centos01到Centos04，在每台服务器创建四个分区格式化为XFS文件系统自动设置开机自动挂载在Centos01到Centos04安装glusterFS分布式存储系统创建配置glusterfs群集和创建分布式条带卷、分布式复制卷、分布式卷、条带卷实验步骤：一.在Centos01到Centos04，在每台服务器创......
分布式事务的21种武器 - 6
在分布式系统中，事务的处理分布在不同组件、服务中，因此分布式事务的ACID保障面临着一些特殊难点。本系列文章介绍了21种分布式事务设计模式，并分析其实现原理和优缺点，在面对具体分布式事务问题时，可以选择合适的模式进行处理。原文:ExploringSolutionsforDistributedTransactio......

centos7上Hadoop2.7.2完全分布式部署

相关文章

赞助商

阅读排行