首页 > 系统相关 >在CentOS7上搭建hadoop集群

在CentOS7上搭建hadoop集群

时间:2024-04-09 10:45:16浏览次数:37  
标签:hadoop yarn CentOS7 export 集群 master HOME root

hadoop官方下载地址https://hadoop.apache.org/releases.html
用到的命令/root/hadoop-3.4.0/bin/hdfs namenode -format ,start-all.sh, stop-all.sh
1.三台虚拟机分别设置静态ip
2.设置免密登录 (更改主机名、添加映射)
3.配置hadoop (添加环境变量)
core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml slaves

点击查看代码
  <property>
        <name>fs.default.name</name>
        <value>hdfs://master:9000</value>
  </property>
  <property>
        <name>hadoop.tmp.dir</name>
        <value>/root/hadoop-3.4.0/tmp</value>
  </property>

点击查看代码
      <property>
        <name>dfs.replication</name>
        <value>2</value>
      </property>
      <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/root/hadoop-3.4.0/dfs/name</value>
      </property>
      <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/root/hadoop-3.4.0/dfs/data</value>
      </property>

点击查看代码
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
  <property>
    <name>mapreduce.jobhistory.address</name>
    <value>Master:10020</value>
  </property>
  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>Master:19888</value>
  </property>

点击查看代码
   <!-- Site specific YARN configuration properties -->
      <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
      </property>
      <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
      </property>
      <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:8032</value>
      </property>
      <property>
    <name>yarn.resourcemanager.scheduler.address</name>
        <value>master:8030</value>
      </property>
      <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>master:8031</value>
      </property>
      <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>master:8033</value>
      </property>
      <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>master:8088</value>
      </property>

点击查看代码
clone1
clone2
4.初始化、启动与关闭

更改主机名用于区分,添加映射以便ssh时用主机名代替ip
在linux里添加hadoop的环境变量,在hadoop里添加java的环境变量。

点击查看代码

[root@master ~]# vim /etc/profile

//省略前文
#Java
export JAVA_HOME=/root/jdk1.8.0_401
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:JAVA_HOME/lib/dt.jar
export PATH=$PATH:$JAVA_HOME/bin
#Hadoop
export HADOOP_HOME=/root/hadoop-3.4.0
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/libexec
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root


[root@master hadoop-3.4.0]# vim  /root/had*/etc/hadoop/hadoop-env.sh

//省略前文
#  JAVA_HOME=/usr/java/testing hdfs dfs -ls
JAVA_HOME=/root/jdk1.8.0_401
#
# Therefore, the vast majority (BUT NOT ALL!) of these defaults
# are configured for substitution and not append.  If append
# is preferable, modify this file accordingly.
//省略后文





[root@master hadoop-3.4.0]# vim  /root/had*/etc/hadoop/yarn-env.sh

//省略前文
###

# YARN Services parameters
###
# Directory containing service examples
# export YARN_SERVICE_EXAMPLES_DIR = $HADOOP_YARN_HOME/share/hadoop/yarn/yarn-service-examples
# export YARN_CONTAINER_RUNTIME_DOCKER_RUN_OVERRIDE_DISABLE=true
JAVA_HOME=/root/jdk1.8.0_401

用scp在启动前把配置好的文件和hadoop发送过去

标签:hadoop,yarn,CentOS7,export,集群,master,HOME,root
From: https://www.cnblogs.com/used-conduit-onion/p/18123250

相关文章

  • 全国首个!天翼云上海临港国产单池万卡液冷算力集群启用!
    3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,八家合作伙伴宣布将作为首批用户入驻临港国产算力池。这是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体公共智算中心。通过中国电信天翼云打造的人工智能公共算力服务平台,将以公共......
  • CentOS7设置ssh本机免密登录
    点击查看代码登出Connectiontoclone1closed.[root@master.ssh]#ll总用量16-rw-rw-r--.1rootroot3934月909:23authorized_keys-rw-------.1rootroot16794月719:16id_rsa-rw-r--r--.1rootroot3934月719:16id_rsa.pub-rw-r--r--.1r......
  • Redis中的集群(一)
    集群概述Redis集群是Redis提供的分布式数据库方案,集群通过分片(sharding)来进行数据共享,并提供复制和故障转移功能节点一个Redis集群通常由多个节点(node)组成,在刚开始的时候,每个节点都是相互独立的,它们都处于一个只包含自己的集群当中,要组建一个真正可工作的集群,则必须......
  • 手把手带你,在K8S集群中删除处于 "terminating" 状态命名空间。
    1.背景背景:在Kubernetes集群中,有时侯想要删掉某个长时间不用命名空间以释放资源却发现删不掉,经过反复删除发现想要删除命名空间处在Terminating状态,强制删除也无济于事。作者也遇到这样事情,我又是如何删除掉呢?#kubectlgetnsNAMESTATUSAGEdefaul......
  • 全国首/个!天翼云上海临港国产单池万卡液冷算力集群启用!
    3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,八家合作伙伴宣布将作为首批用户入驻临港国产算力池。这是国内首/个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体公共智算中心。通过中国电信天翼云打造的人工智能公共算力服务平台,将以公共普......
  • Kafka 集群架构
    Kafka集群架构设计旨在提供高吞吐量、低延迟、容错性和可扩展性的消息传递服务。以下是Kafka集群架构的关键组成部分及其工作原理:核心组件BrokerBroker是Kafka集群中的一个独立服务器实例。每个Broker负责维护一部分Topic的Partition,并提供消息的接收、存储、检索和转发......
  • Hadoop集群下的wordcount运行出错类型及解决方法
    1、启动wordcont程序显示异常:原因:2、显示服务器连接不成功:原因:虚拟机配置问题,导致yarn服务没有启动3、运行结果不正确:原因:暂未发现,求解答......
  • CentOS7 虚拟机 ens33网卡失效
    之前虚拟机ssh连接没问题,今天竟然连不上了。打开虚拟机ipa网卡ens33没有iproot@ubuntu:~/Desktop#ipa1:lo:<LOOPBACK,UP,LOWER_UP>mtu65536qdiscnoqueuestateUNKNOWNgroupdefaultqlen1000link/loopback00:00:00:00:00:00brd00:00:00:00:00:00inet1......
  • 【操作系统】CentOS7入门级安装
    下载镜像CentOS镜像下载Download(centos.org)我们选择第一个X86_64CentOSMirrorsList版本描述X86_X64带64位的32位扩展版(一般安装这个)ARM64(aarch64)嵌入式。适用于微端(树莓派、机械臂、机械中控)IBMPower(ppc64le)专用于IBMPOWER服务器选择一个合适的链接......
  • 布署到centos7.9时,ModuleNotFoundError No module named ‘_sqlite3‘
    先下载编译sqlite3wgethttp://www.sqlite.org/sqlite-3.5.6.tar.gzcdsqlite-3.5.6./configure--disable-tclmake&&makeinstall注意addLIBDIRtothe‘LD_LIBRARY_PATH’environmentvariable,这是sqlite建议添加环境变量。所以:echoexportLD_LIBRARY_PATH=/usr/......