2-Hadoop集群配置-安装-启动

时间：2023-04-27 16:37:12浏览次数：40

标签：hdfs Hadoop yarn hadoop host 集群 mapreduce 安装 HADOOP

1、流程说明

在单机测试wordcount没问题后，开始配置集群模式

说明: hadoop有几个功能

① hdfs存

NameNode

SecondNameNode

DataNode

②yarn资源调度

ResourceManager

NodeManager

③mapreduce计算

有Job任务的时候才会有

每台机器都有 hdfs的datanode, 都有 yarn的nodemanager;

对于 NameNode/SecondeNameNode分别放在第一台和第三台机器上

对于ResourceManger放在第二台机器上

流程为：

修改配置文件 5个(hdfs/yarn/mapreduce/workders/core)，修改后分发

格式化namenode

启动hdfs/yarn

2、修改配置文件

hadoop/etc/hadoop/ 这个路径下的5个文件

core

hdfs

yarn

mapreduce

workers

1. core-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
<!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://node001:8020</value>
    </property>

    <!-- 指定hadoop数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop-3.1.3/data</value>
    </property>

    <!-- 配置HDFS网页登录使用的静态用户为atguigu -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>xing</value>
    </property>
</configuration>

2. hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

	<!-- nn web端访问地址-->
	<property>
        <name>dfs.namenode.http-address</name>
        <value>node001:9870</value>
    </property>
	<!-- 2nn web端访问地址-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>node003:9868</value>
    </property>
</configuration>

3. yarn-site.xml

<?xml version="1.0"?>

<configuration>

 	<!-- 指定MR走shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

    <!-- 指定ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>node002</value>
    </property>

    <!-- 环境变量的继承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
</configuration>

4. mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

	<!-- 指定MapReduce程序运行在Yarn上 -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

5. workers

这个文件里不能包含任何多余的行或者空格

node001
node002
node003

6. 分发

xsync hadoop/etc/hadoop/*

3、格式化NameNode

# 再需要设置NameNode的机器上执行
hdfs namenode -format

# 若出错，请看日志 hadoop/logs/

4、启动

# 1. 先启动hdfs , 再启动yarn;  关闭时先关闭yarn,再关闭hdfs
start-dfs.sh # 任何一台机器都可以
start-yarn.sh # 只能ResourceManager那台机器启动

# 2. jps测试
jps

5、jpsall脚本

#!/bin/bash
for host in node001 node002 node003
do
	echo "===========${host} jps============"
	ssh $host "jps"
done

6、如果重复格式化nn解决

# 1. reboot所有机器

# 2.  删除集群所有 data,logs,/tmp/*

#!/bin/bash
for host in node001 node002 node003
do
	ssh $host "rm -rf /opt/module/hadoop-3.1.3/data"
	ssh $host "rm -rf /opt/module/hadoop-3.1.3/logs"
	ssh $host "sudo rm -rf /tmp/*"
	echo "++++++++++++${host}已删除++++++++++++"
done

标签：hdfs,Hadoop,yarn,hadoop,host,集群,mapreduce,安装,HADOOP
From： https://www.cnblogs.com/dataxing/p/17359290.html

WIN7下安装VUE3.0
1、准备工作（你可以检查，清楚的话可以不用管）1.1、检查nodejs版本：node-v1.2、检车npm版本:npm-v1.3、查看VUE脚手架版本:vue--version或vue-V（大写的V）1.4、卸载VUE2版本命令：npmuninstallvue-cli-g1.5、卸载VUE3版本命令：npmuninstall-g@vue/cli2.下载node.js及配置tip......
Linux安装配置达梦数据库教程
1.安装规范：为方便之后统一运维管理，现规定以下信息：安装包和密钥存放目录：/boban安装目录：/home/dmdba/dmdbms数据目录：/dbdata/dmdata挂载目录：/mnt2.数据安装工作：数据库安装准备工作：创建组：[root@localhost/]#groupadddinstall创建用户：[root@localhost/]#useradd-gdinst......
虚拟机安装docker镜像
一、下载centOs镜像文件下载地址：http://mirrors.aliyun.com/centos/7/isos/x86_64/ （目前试例选择的是CentOS-7-x86_64-DVD-2009.iso：桌面版，也可根据需求选择Everything版本的，基本上包含了全部配置）二、下载VMware 目前选择的是 16破解版，随便下载找个下载地......
Windows 11安装跳过联网
方案1在选择WIFI联网的界面，不要连接网络。Shift+F10（或者Fn+Shift+F10），打开cmd窗口，输入命令：oobe\BypassNRO.cmd重启后会有一个我没有互联网的选项。如果是台式，记得先拔出网线。方案2改注册表在选择WIFI联网的界面，不要连接网络。Shift+F10（或者Fn+Shift+F10），打开cmd窗口，输入......
ubuntu安装nodejs 14
nodejs的每个大版本号都有相对应的源，比如这里的10.x.x版本的源是https://deb.nodesource.com/setup_10.x。所以在终端执行：curl-sLhttps://deb.nodesource.com/setup_14.x|sudo-Ebash-点击查看命令解释这个命令是用来添加Node.js14.x的仓库地址。具体来说，它通......
小知识：使用oracle用户查看RAC集群资源状态
正常情况按照标准配置的环境变量，只能grid用户查看RAC集群资源状态。crsctlstatres-t但是绝大部分操作其实都是oracle用户来操作，比如启停数据库，操作完成以后就需要检查下集群资源状态。看到好多DBA在现场操作时就是来回各种切换或开多个窗口。其实有两个简单的解决方法可以......
Hadoop-HDFS压测】针对HDFS进行读写性能测试
【Hadoop-HDFS压测】针对HDFS进行读写性能测试1）测试工具2）写入数据测试3）读取数据测试4）清除数据1)测试工具Hadoop自身集成的工具包：hadoop-mapreduce-client-jobclient-3.1.1.jar注意：1、如果是Apache版本安装的Hadoop默认在lib目录下，如果是CDH版本安装的Hadoop需要自己去对......
docker安装mysql
Docker安装MySQLDocker是一个开源的容器化平台，可以方便地搭建各种环境，包括MySQL数据库。在本教程中，我们将介绍如何使用Docker安装MySQL。步骤1：安装Docker首先，您需要在您的计算机上安装Docker。您可以在Docker官方网站下载适用于您的操作系统的DockerDesktop应用程序并安装。......
Ubuntu 22.04.1 LTS 安装 MinIO
一、首先准备两个目录#安装目录mkdir-p/usr/local/softs/minio#数据存储目录mkdir-p/root/minio/data#日志存储目录mkdir-p/root/minio/logs 二、安装1、下载软件cd/usr/local/softs/minio/wgethttps://dl.minio.io/server/minio/release/linux-amd64/......
npm安装yarn报npm ERR Unexpected token ‘.‘错误的解决办法
问题背景最近发现很多前端框架或前端产品的学习和使用都用到了yarn，一开始不知道这是干什么的，后在网上搜索说是JS包管理工具，我一致都是用的nodeJs，难道node过时了，然后有一顿搜索，网上是这么介绍的。Yarn是什么？“Yarn是由Facebook、Google、Exponent和Tilde联合推出了一个新的JS......

2-Hadoop集群配置-安装-启动

1、流程说明

2、修改配置文件

1. core-site.xml

2. hdfs-site.xml

3. yarn-site.xml

4. mapred-site.xml

5. workers

6. 分发

3、格式化NameNode

4、启动

5、jpsall脚本

6、如果重复格式化nn解决

相关文章

赞助商

阅读排行

2-Hadoop集群配置-安装-启动

1、 流程说明

2、修改配置文件

1. core-site.xml

2. hdfs-site.xml

3. yarn-site.xml

4. mapred-site.xml

5. workers

6. 分发

3、 格式化NameNode

4、 启动

5、jpsall脚本

6、如果重复格式化nn解决

相关文章

赞助商

阅读排行

1、流程说明

3、格式化NameNode

4、启动