首页 > 其他分享 >hadoop-3.1.2分布式搭建

hadoop-3.1.2分布式搭建

时间:2024-11-01 22:31:28浏览次数:4  
标签:配置文件 hadoop systemctl master 3.1 node1 export 分布式

一、准备工作

三台虚拟机:

master、node1、node2

时间同步
关闭防火墙:

systemctl stop firewalld

查看防火墙状态:

systemctl status firewalld

取消防火墙自启:

systemctl disable firewalld

修改主机名

三台分别执行 vim /etc/hostname 并将内容指定为对应的主机

静态IP配置

vim /etc/sysconfig/network-scripts/ifcfg-ens33

关闭NetworkManager,并取消开机自启

systemctl stop NetworkManager
systemctl disable NetworkManager
systemctl status NetworkManager

免密登录

1、生成密钥
ssh-keygen -t rsa
2、配置免密登录
ssh-copy-id master
ssh-copy-id node1
ssh-copy-id node2
3、测试免密登录
ssh node1

配置好映射文件:

vim /etc/hosts
192.168.6.101 master
192.168.6.102 node1
192.168.6.103 node2

配置jdk

java -version

二、hadoop-3.1.1分布式搭建

1、上传解压配置环境变量

  • 解压

tar -zxvf hadoop-3.1.2.tar.gz

  • 配置环境变量

vim /etc/profile

  • 使环境变量生效

source /etc/profile

2、修改配置文件

  • 1、进入hadoop配置文件所在位置,修改hadoop配置文件

cd /usr/local/soft/hadoop-3.1.2/etc/hadoop

  • 2、修改core-site.xml配置文件,在configuration中间增加配置
<configuration>
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://master:9000</value>
</property>
<property>
  <name>hadoop.tmp.dir</name>
  <value>/usr/local/soft/hadoop-3.1.2/tmp</value>
</property>
<property>
  <name>fs.trash.interval</name>
  <value>1440</value>
</property>
</configuration>

  • 3、修改hdfs-site.xml配置文件,在configuration中间增加配置
<configuration>
<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>
<property>
  <name>dfs.permissions</name>
  <value>false</value>
</property>
</configuration>

  • 4、修改yarn-site.xml配置文件,在configuration中间增加配置
<property>
  <name>yarn.resourcemanager.hostname</name>
  <value>master</value>
</property>
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
</property>
<property>
  <name>yarn.log-aggregation-enable</name>
  <value>true</value>
</property>

  • 5、修改mapred-site.xml配置文件,在configuration中间增加配置
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>master:10020</value>
    </property>

    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>master:19888</value>
    </property>
</configuration>

  • 6、修改hadoop-env.sh配置文件
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

  • 7、修改 workers 配置文件
node1
node2

  • 8、初始化hdfs

hdfs namenode -format

  • 9、启动hadoop

start-all.sh

master

node1

node2

  • 10、停止hadoop

stop-all.sh

三、格式化集群

  • 1、关闭集群

stop-all.sh

  • 2、删除每个节点的hadoop根目录下的tmp目录

rm -rf tmp/

  • 3、重新格式化 在hadoop的bin目录下执行

hdfs namenode -format

  • 4、重新启动

start-all.sh

标签:配置文件,hadoop,systemctl,master,3.1,node1,export,分布式
From: https://www.cnblogs.com/w-ll/p/18521396

相关文章

  • 51单片机 3.1独立按键的基本操作
    一、电路图及分析(部分解释参考网络,仅用于学习记录)蓝桥杯单片机的板子将独立按键和矩阵按键结合了起来,通过一个短接片选择使用独立按键还是矩阵按键。首先我们先看原理图的左下角绿色方框所标的地方,这里与我们板子上的短接片所对应,是选择按键工作模式的地方。  如果短......
  • 招聘大数据可视化分析系统 求职就业数据分析 Flask框架 hadoop和spark技术(建议收藏)✅
    博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久,选择我们就是选择放心、选择安心毕业✌>......
  • 电能质量治理产品在分布式光伏电站的应用
    1.概述随着全球对可再生能源需求的不断增长,分布式光伏电站的建设与扩张正迅速发展。然而,在其运行过程中,分布式光伏电站遭遇了一系列挑战,包括企业关口计量点功率因数降低和谐波污染等问题。这些问题不仅影响了光伏电站的运行效率,还对企业的电网稳定性和电费成本产生了不利影响......
  • hadoop+Spark+django基于大数据技术的国内运动男装小红书文章数据可视化分析系统(源码
    收藏关注不迷路!!......
  • Hadoop未授权访问
    Hadoop未授权访问是什么?Hadoop是一种用来处理和存储大量数据的软件工具,可以用来日志分析,推荐系统,数据备份  核心组件:存储大数据:HDFS文件系统处理大数据:MapReduce管理资源:YARN  漏洞成因(本质是API路径未授权):默认开放的RESTAPI端口:YARN的RESTAP默认开放在8088和8......
  • Hadoop安装部署
    Hadoop安装部署一、虚拟机配置1、创建3台虚拟机:master、node1、node22、关闭防火墙systemctlstopfirewalld.service#停止firewallsystemctldisablefirewalld.service#禁止firewall开机启动查看防火墙状态firewall-cmd--statesystemctlstatusfirewalld.service......
  • Hadoop基础知识整理
    一、HDFS1.HDFS概述Hadoop分布式系统框架中,首要的基础功能就是文件系统,在Hadoop中使用FileSystem这个抽象类来表示我们的文件系统,这个抽象类下面有很多子实现类,究竟使用哪一种,需要看我们具体的实现类,在我们实际工作中,用到的最多的就是HDFS(分布式文件系统)以及LocalFileSy......
  • Hadoop-MapReduce任务三种运行开发模式
    1、local模式数据在本地,代码也在本地,使用本机的电脑的资源运行我们的MR输入和输出路径指的都是本地路径,运行时耗费的资源也是本地资源。2、local模式2数据在hdfs上,代码在本地,使用本机的电脑的资源运行我们的MRSystem.setProperty("HADOOP_USER_NAME","root");......
  • 当访问该网站时失败,提示Forbidden或HTTP 错误 403.14 - Forbidden报错信息
    当您遇到“Forbidden”或“HTTP错误403.14-Forbidden”时,这通常意味着服务器理解了请求,但拒绝执行。这种错误可能由多种原因引起,以下是一些常见的解决方法:检查URL:确保输入的网址正确无误。检查是否有任何多余的字符或拼写错误。服务器配置问题:对于IIS服务器,403.14......
  • 怎么利用hadoop搭建自己的云计算
    我们为了能够更加方便来识别主机,我们使用主机名而不是使用IP地址,以免多处配置带来更多的麻烦。把hd-master、hd-node1、hd-node2三台虚拟机服务器中的主机名(hostname)分别更改为master、node1、node2。一、怎么利用hadoop搭建自己的云计算(1)我们为了能够更加方便来识别主机,......