首页 > 其他分享 >hadoop集群部署

hadoop集群部署

时间:2024-12-25 18:19:11浏览次数:3  
标签:xml hdfs 部署 hadoop yarn site 集群 HADOOP

1.前置条件及准备工作

  • SSH免密登录
  • JDK1.8
  • 上传tar包
  • 远程调用脚本及远程同步脚本

远程调用脚本

#!/bin/bash

p_cnt=$#
if (( p_cnt<1 )) ; then
	echo no args;
	exit ;
fi


cuser=`whoami`
for host in node1 node2 node3
do
	echo --------- $host -----------
	ssh -p 60022 $cuser@$host $@
done

远程同步脚本

#!/bin/bash

p_cnt=$#
if (( p_cnt<1 )) ; then
	echo no args;
	exit ;
fi

file=$1
fname=`basename $file`
echo fname=$fname

fdir=`cd -P $(dirname $file) ; pwd`
echo fdir=$fdir

cuser=`whoami`
for host in node1 node2 node3
do
	echo --------- host$host -----------
	rsync -av $fdir/$fname -e 'ssh -p 60022' $cuser@$host:$fdir
done

2. 集群部署

  • 解压tar包
  • 修改配置文件
  • 文件夹同步
  • 启动命令

修改配置文件hadoop-env.sh/core-site.xml/hdfs-site.xml/yarn-site.xml/mapred-site.xml

hadoop-env.sh

# (1)JDK配置
# (2)由于SSH端口改成了60022,这里需设置
export HADOOP_SSH_OPTS="-p 60022"

core-site.xml

<configuration>
   <!--指定namenode的地址-->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://node1:8020</value>
		</property>
   <!--用来指定使用hadoop时产生文件的存放目录-->
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/opt/core/hadoop-3.3.6/data</value>
	</property>
   <!--配置HDFS网页登录使用的静态用户为foo-->
	<property>
		<name>hadoop.http.staticuser.user</name>
		<value>foo</value>
	</property>
</configuration>

hdfs-site.xml

<configuration>
	<!-- nn web 端访问地址-->
	<property>
		<name>dfs.namenode.http-address</name>
		<value>node1:9870</value>
	</property>
	
	<!-- 2nn web 端访问地址-->
	<property>
		<name>dfs.namenode.secondary.http-address</name>
		<value>node2:9868</value>
	</property>
</configuration>

yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

	<!--nomenodeManager获取数据的方式是shuffle-->
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
       <!--指定Yarn的老大(ResourceManager)的地址-->     
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>node3</value>
	</property> 
	
	<property>
		<name>yarn.nodemanager.env-whitelist</name>
		<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
	</property>

</configuration>

mapred-site.xml

<configuration>
	<!--告诉hadoop以后MR(Map/Reduce)运行在YARN上-->
	<property>
		  <name>mapreduce.framework.name</name>
		  <value>yarn</value>
	</property>
</configuration>

启动命令

# namenode格式化,在node1
hdfs namonode -format
# 启动hdfs,在node1
sbin/start-hdfs.sh

# 启动yarn,在node3
sbin/start-yarn.sh

3. 问题处理

启动hdfs时报错,ssh端口22禁止访问

# 修改hadoop-env.sh,设置SSH参数

启动hdfs报错,Encountered exception loading fsimage java.io.IOException: File system image contains an old layout version -60. An upgrade to version -66 is required.

# 新搭建的集群,namenode格式化后生成的VERSION文件中layout version默认是-60,所以启动时报错,将VERSION文件中的-60改为-66即可,重新启动hdfs

4. 引用

Hadoop搭建集群
Apache Hadoop
Hadoop NameNode元数据相关文件目录解析
rsync命令技巧
关于修改ssh端口号处理办法

标签:xml,hdfs,部署,hadoop,yarn,site,集群,HADOOP
From: https://www.cnblogs.com/route/p/18631197

相关文章

  • redis7.4 集群配置
    集群规划节点规划redis-01192.168.174.108redis-02192.168.174.112redis-03192.168.174.117redis-04192.168.174.114redis-05192.168.174.115redis-06192.168.174.116redis-07192.168.174.118redis-08192.168.174.119redis服务配置redis.conf配置sed-i-e......
  • centos环境下使用docker部署.net8
    创建项目创建.net8版本的webapi项目创建dockerfile有两种创建dockerfile文件的方式,一是创建项目的时候勾选“启用容器支持”,如图1所示,二是在解决方案资源管理器中鼠标右键项目,选择“添加”,再点击“Docker支持”,在弹出的弹框中进行选择,如图2所示。图1图2:dockerfile......
  • nuxt3打包部署正式环境更改端口号
    Nuxt3默认的端口号3000.如果我们在一台服务器中部署多个Nuxt应用,都是3000端口必然会冲突,所以需要修改默认的端口号。在官网文档中,介绍的端口号修改方式是修改env环境变量。这个方式在Vercel或者一些serverless环境非常方便,在自己的服务器中,不可能设置多个PORT变量,所以有点鸡肋。下......
  • Springboot旧衣捐赠平台设计与实现p40x5(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表用户,公益活动,捐赠信息,物品分类,地区分类,捐赠数据,捐赠接收开题报告内容一、研究背景与意义研究背景随着经济的快速发展和消费意识的提高,旧衣物的废弃量不......
  • Springboot旧商品销售系统4104m(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表用户,卖家,商品分类,商品信息开题报告内容一、项目背景与意义随着经济的快速发展和人们消费观念的转变,旧商品市场逐渐兴起。许多消费者开始注重资源的循环利用,......
  • Springboot旧教材交易系统a6151(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表用户,书籍类型,书籍信息开题报告内容一、研究背景随着高等教育的普及和校园生活的丰富多彩,学生们在学习和生活中积累了大量的旧教材。这些旧教材对于个人而言,可......
  • 私有化部署视频平台EasyCVR打造安防监控系统时,如何确保监控数据的安全?
    在数字化时代,监控数据的安全和隐私保护已成为全球关注的焦点。随着技术的进步,监控系统不仅需要提供清晰的视频监控,还需要确保数据的安全性。以下是一些关键措施,它们可以帮助我们在保护监控数据的同时,遵守法律法规,维护个人隐私和企业安全。1、物理访问控制通过数据库锁定、视频......
  • 预测类算法实施全攻略:从数据到部署的完整流程
    一、问题定义明确目标变量:确定要预测的对象,例如预测股票价格、客户流失率、天气状况等。清晰地定义目标变量的含义和范围。了解业务背景:深入研究问题所在的领域,如在预测电商销售额时,需要了解产品类型、销售渠道、促销活动等因素对销售额的影响。确定预测期限:明确是进行短期预......
  • 备忘<大模型>--gpt4all本地可部署
    1.下载安装包https://www.nomic.ai/gpt4all2.下载模型https://docs.gpt4all.io/gpt4all_desktop/models.html#example-modelshttps://blog.csdn.net/mc_dudu233/article/details/140988148(参考该博客成功)https://www.freedidi.com/11195.html(可直接下载的以gguf结尾的模型)https://......
  • ssm美食分享平台2io0w(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、研究背景随着互联网的普及和生活水平的提高,人们对美食的追求日益增加。美食不仅满足口腹之欲,更成为了一种生活方式和文化体验。然而,现有的美食......