首页 > 其他分享 >2-Hadoop集群配置-安装-启动

2-Hadoop集群配置-安装-启动

时间:2023-04-27 16:37:12浏览次数:37  
标签:hdfs Hadoop yarn hadoop host 集群 mapreduce 安装 HADOOP

1、 流程说明

在单机测试wordcount没问题后,开始配置集群模式

说明: hadoop有几个功能

​ ① hdfs存

​ NameNode

​ SecondNameNode

​ DataNode

​ ②yarn资源调度

​ ResourceManager

​ NodeManager

​ ③mapreduce计算

​ 有Job任务的时候才会有

每台机器都有 hdfs的datanode, 都有 yarn的nodemanager;

对于 NameNode/SecondeNameNode分别放在第一台和第三台机器上

对于ResourceManger放在第二台机器上

流程为:

  1. 修改配置文件 5个(hdfs/yarn/mapreduce/workders/core),修改后分发
  2. 格式化namenode
  3. 启动hdfs/yarn

2、修改配置文件

hadoop/etc/hadoop/ 这个路径下的5个文件

  1. core
  2. hdfs
  3. yarn
  4. mapreduce
  5. workers

1. core-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
<!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://node001:8020</value>
    </property>

    <!-- 指定hadoop数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop-3.1.3/data</value>
    </property>

    <!-- 配置HDFS网页登录使用的静态用户为atguigu -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>xing</value>
    </property>
</configuration>

2. hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

	<!-- nn web端访问地址-->
	<property>
        <name>dfs.namenode.http-address</name>
        <value>node001:9870</value>
    </property>
	<!-- 2nn web端访问地址-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>node003:9868</value>
    </property>
</configuration>

3. yarn-site.xml

<?xml version="1.0"?>

<configuration>

 	<!-- 指定MR走shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

    <!-- 指定ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>node002</value>
    </property>

    <!-- 环境变量的继承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
</configuration>

4. mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

	<!-- 指定MapReduce程序运行在Yarn上 -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

5. workers

  • 这个文件里不能包含任何多余的行或者空格
node001
node002
node003

6. 分发

xsync hadoop/etc/hadoop/*

3、 格式化NameNode

# 再需要设置NameNode的机器上执行
hdfs namenode -format

# 若出错,请看日志 hadoop/logs/

4、 启动

# 1. 先启动hdfs , 再启动yarn;  关闭时先关闭yarn,再关闭hdfs
start-dfs.sh # 任何一台机器都可以
start-yarn.sh # 只能ResourceManager那台机器启动

# 2. jps测试
jps

5、jpsall脚本

#!/bin/bash
for host in node001 node002 node003
do
	echo "===========${host} jps============"
	ssh $host "jps"
done

6、如果重复格式化nn解决

# 1. reboot所有机器

# 2.  删除集群所有 data,logs,/tmp/*

#!/bin/bash
for host in node001 node002 node003
do
	ssh $host "rm -rf /opt/module/hadoop-3.1.3/data"
	ssh $host "rm -rf /opt/module/hadoop-3.1.3/logs"
	ssh $host "sudo rm -rf /tmp/*"
	echo "++++++++++++${host}已删除++++++++++++"
done

标签:hdfs,Hadoop,yarn,hadoop,host,集群,mapreduce,安装,HADOOP
From: https://www.cnblogs.com/dataxing/p/17359290.html

相关文章

  • WIN7下安装VUE3.0
    1、准备工作(你可以检查,清楚的话可以不用管)1.1、检查nodejs版本:node-v1.2、检车npm版本:npm-v1.3、查看VUE脚手架版本:vue--version或vue-V(大写的V)1.4、卸载VUE2版本命令:npmuninstallvue-cli-g1.5、卸载VUE3版本命令:npmuninstall-g@vue/cli2.下载node.js及配置tip......
  • Linux安装配置达梦数据库教程
    1.安装规范:为方便之后统一运维管理,现规定以下信息:安装包和密钥存放目录:/boban安装目录:/home/dmdba/dmdbms数据目录:/dbdata/dmdata挂载目录:/mnt2.数据安装工作:数据库安装准备工作:创建组:[root@localhost/]#groupadddinstall创建用户:[root@localhost/]#useradd-gdinst......
  • 虚拟机安装docker镜像
    一、下载centOs镜像文件    下载地址:http://mirrors.aliyun.com/centos/7/isos/x86_64/ (目前试例选择的是CentOS-7-x86_64-DVD-2009.iso:桌面版,也可根据需求选择Everything版本的,基本上包含了全部配置)二、下载VMware   目前选择的是 16破解版,随便下载找个下载地......
  • Windows 11安装跳过联网
    方案1在选择WIFI联网的界面,不要连接网络。Shift+F10(或者Fn+Shift+F10),打开cmd窗口,输入命令:oobe\BypassNRO.cmd重启后会有一个我没有互联网的选项。如果是台式,记得先拔出网线。方案2改注册表在选择WIFI联网的界面,不要连接网络。Shift+F10(或者Fn+Shift+F10),打开cmd窗口,输入......
  • ubuntu安装nodejs 14
    nodejs的每个大版本号都有相对应的源,比如这里的10.x.x版本的源是https://deb.nodesource.com/setup_10.x。所以在终端执行:curl-sLhttps://deb.nodesource.com/setup_14.x|sudo-Ebash-点击查看命令解释这个命令是用来添加Node.js14.x的仓库地址。具体来说,它通......
  • 小知识:使用oracle用户查看RAC集群资源状态
    正常情况按照标准配置的环境变量,只能grid用户查看RAC集群资源状态。crsctlstatres-t但是绝大部分操作其实都是oracle用户来操作,比如启停数据库,操作完成以后就需要检查下集群资源状态。看到好多DBA在现场操作时就是来回各种切换或开多个窗口。其实有两个简单的解决方法可以......
  • Hadoop-HDFS压测】针对HDFS进行读写性能测试
    【Hadoop-HDFS压测】针对HDFS进行读写性能测试1)测试工具2)写入数据测试3)读取数据测试4)清除数据1)测试工具Hadoop自身集成的工具包:hadoop-mapreduce-client-jobclient-3.1.1.jar注意:1、如果是Apache版本安装的Hadoop默认在lib目录下,如果是CDH版本安装的Hadoop需要自己去对......
  • docker安装mysql
    Docker安装MySQLDocker是一个开源的容器化平台,可以方便地搭建各种环境,包括MySQL数据库。在本教程中,我们将介绍如何使用Docker安装MySQL。步骤1:安装Docker首先,您需要在您的计算机上安装Docker。您可以在Docker官方网站下载适用于您的操作系统的DockerDesktop应用程序并安装。......
  • Ubuntu 22.04.1 LTS 安装 MinIO
    一、首先准备两个目录#安装目录mkdir-p/usr/local/softs/minio#数据存储目录mkdir-p/root/minio/data#日志存储目录mkdir-p/root/minio/logs 二、安装1、下载软件cd/usr/local/softs/minio/wgethttps://dl.minio.io/server/minio/release/linux-amd64/......
  • npm安装yarn报npm ERR Unexpected token ‘.‘错误的解决办法
    问题背景最近发现很多前端框架或前端产品的学习和使用都用到了yarn,一开始不知道这是干什么的,后在网上搜索说是JS包管理工具,我一致都是用的nodeJs,难道node过时了,然后有一顿搜索,网上是这么介绍的。Yarn是什么?“Yarn是由Facebook、Google、Exponent和Tilde联合推出了一个新的JS......