hadoop集群部署

时间：2024-12-25 18:19:11浏览次数：3

标签：xml hdfs 部署 hadoop yarn site 集群 HADOOP

1.前置条件及准备工作

SSH免密登录
JDK1.8
上传tar包
远程调用脚本及远程同步脚本

远程调用脚本

#!/bin/bash

p_cnt=$#
if (( p_cnt<1 )) ; then
	echo no args;
	exit ;
fi


cuser=`whoami`
for host in node1 node2 node3
do
	echo --------- $host -----------
	ssh -p 60022 $cuser@$host $@
done

远程同步脚本

#!/bin/bash

p_cnt=$#
if (( p_cnt<1 )) ; then
	echo no args;
	exit ;
fi

file=$1
fname=`basename $file`
echo fname=$fname

fdir=`cd -P $(dirname $file) ; pwd`
echo fdir=$fdir

cuser=`whoami`
for host in node1 node2 node3
do
	echo --------- host$host -----------
	rsync -av $fdir/$fname -e 'ssh -p 60022' $cuser@$host:$fdir
done

2. 集群部署

解压tar包
修改配置文件
文件夹同步
启动命令

修改配置文件hadoop-env.sh/core-site.xml/hdfs-site.xml/yarn-site.xml/mapred-site.xml

hadoop-env.sh

# （1）JDK配置
# （2）由于SSH端口改成了60022，这里需设置
export HADOOP_SSH_OPTS="-p 60022"

core-site.xml

<configuration>
   <!--指定namenode的地址-->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://node1:8020</value>
		</property>
   <!--用来指定使用hadoop时产生文件的存放目录-->
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/opt/core/hadoop-3.3.6/data</value>
	</property>
   <!--配置HDFS网页登录使用的静态用户为foo-->
	<property>
		<name>hadoop.http.staticuser.user</name>
		<value>foo</value>
	</property>
</configuration>

hdfs-site.xml

<configuration>
	<!-- nn web 端访问地址-->
	<property>
		<name>dfs.namenode.http-address</name>
		<value>node1:9870</value>
	</property>
	
	<!-- 2nn web 端访问地址-->
	<property>
		<name>dfs.namenode.secondary.http-address</name>
		<value>node2:9868</value>
	</property>
</configuration>

yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

	<!--nomenodeManager获取数据的方式是shuffle-->
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
       <!--指定Yarn的老大(ResourceManager)的地址-->     
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>node3</value>
	</property> 
	
	<property>
		<name>yarn.nodemanager.env-whitelist</name>
		<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
	</property>

</configuration>

mapred-site.xml

<configuration>
	<!--告诉hadoop以后MR(Map/Reduce)运行在YARN上-->
	<property>
		  <name>mapreduce.framework.name</name>
		  <value>yarn</value>
	</property>
</configuration>

启动命令

# namenode格式化，在node1
hdfs namonode -format
# 启动hdfs，在node1
sbin/start-hdfs.sh

# 启动yarn，在node3
sbin/start-yarn.sh

3. 问题处理

启动hdfs时报错，ssh端口22禁止访问

# 修改hadoop-env.sh，设置SSH参数

启动hdfs报错，Encountered exception loading fsimage java.io.IOException: File system image contains an old layout version -60. An upgrade to version -66 is required.

# 新搭建的集群，namenode格式化后生成的VERSION文件中layout version默认是-60，所以启动时报错，将VERSION文件中的-60改为-66即可，重新启动hdfs

4. 引用

Hadoop搭建集群
 Apache Hadoop
Hadoop NameNode元数据相关文件目录解析
 rsync命令技巧
 关于修改ssh端口号处理办法

标签：xml,hdfs,部署,hadoop,yarn,site,集群,HADOOP
From： https://www.cnblogs.com/route/p/18631197

redis7.4 集群配置
集群规划节点规划redis-01192.168.174.108redis-02192.168.174.112redis-03192.168.174.117redis-04192.168.174.114redis-05192.168.174.115redis-06192.168.174.116redis-07192.168.174.118redis-08192.168.174.119redis服务配置redis.conf配置sed-i-e......
centos环境下使用docker部署.net8
创建项目创建.net8版本的webapi项目创建dockerfile有两种创建dockerfile文件的方式，一是创建项目的时候勾选“启用容器支持”，如图1所示，二是在解决方案资源管理器中鼠标右键项目，选择“添加”，再点击“Docker支持”，在弹出的弹框中进行选择，如图2所示。图1图2：dockerfile......
nuxt3打包部署正式环境更改端口号
Nuxt3默认的端口号3000.如果我们在一台服务器中部署多个Nuxt应用，都是3000端口必然会冲突，所以需要修改默认的端口号。在官网文档中，介绍的端口号修改方式是修改env环境变量。这个方式在Vercel或者一些serverless环境非常方便，在自己的服务器中，不可能设置多个PORT变量，所以有点鸡肋。下......
Springboot旧衣捐赠平台设计与实现p40x5（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表用户,公益活动,捐赠信息,物品分类,地区分类,捐赠数据,捐赠接收开题报告内容一、研究背景与意义研究背景随着经济的快速发展和消费意识的提高，旧衣物的废弃量不......
Springboot旧商品销售系统4104m（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表用户,卖家,商品分类,商品信息开题报告内容一、项目背景与意义随着经济的快速发展和人们消费观念的转变，旧商品市场逐渐兴起。许多消费者开始注重资源的循环利用，......
Springboot旧教材交易系统a6151（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表用户,书籍类型,书籍信息开题报告内容一、研究背景随着高等教育的普及和校园生活的丰富多彩，学生们在学习和生活中积累了大量的旧教材。这些旧教材对于个人而言，可......
私有化部署视频平台EasyCVR打造安防监控系统时，如何确保监控数据的安全？
在数字化时代，监控数据的安全和隐私保护已成为全球关注的焦点。随着技术的进步，监控系统不仅需要提供清晰的视频监控，还需要确保数据的安全性。以下是一些关键措施，它们可以帮助我们在保护监控数据的同时，遵守法律法规，维护个人隐私和企业安全。1、物理访问控制通过数据库锁定、视频......
预测类算法实施全攻略：从数据到部署的完整流程
一、问题定义明确目标变量：确定要预测的对象，例如预测股票价格、客户流失率、天气状况等。清晰地定义目标变量的含义和范围。了解业务背景：深入研究问题所在的领域，如在预测电商销售额时，需要了解产品类型、销售渠道、促销活动等因素对销售额的影响。确定预测期限：明确是进行短期预......
备忘<大模型>--gpt4all本地可部署
1.下载安装包https://www.nomic.ai/gpt4all2.下载模型https://docs.gpt4all.io/gpt4all_desktop/models.html#example-modelshttps://blog.csdn.net/mc_dudu233/article/details/140988148（参考该博客成功）https://www.freedidi.com/11195.html（可直接下载的以gguf结尾的模型）https://......
ssm美食分享平台2io0w（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、研究背景随着互联网的普及和生活水平的提高，人们对美食的追求日益增加。美食不仅满足口腹之欲，更成为了一种生活方式和文化体验。然而，现有的美食......