Hadoop伪分布式安装

时间：2023-06-04 23:06:33浏览次数：42

标签：文件 Hadoop hadoop 主机名 sh vim 安装分布式

Hadoop伪分布式安装

安装环境：Centos7.5，只少2核4G

提前准备：Linux中要安装JDK8，Zookeeper-3.5.7

1. 关闭防火墙

systemctl stop firewalld

systemctl disable firewalld

2. 修改主机名

Hadoop集群中，主机名中尽量不要出现-或者_

vim /etc/hostname

将原来的主机名删除，添加自己指定的主机名

3. 需要将主机名和IP进行映射

vim /etc/hosts

进入文件之后，除了127.0.0.1以及::1这开头的两行以外，其余的行全部删除

之后添加当前主机的IP 主机名，例如

10.10.153.69 hadoop01

4. 关闭SELINUX

vim /etc/selinux/config

将SELINUX属性的值改为disabled

5. 重启

reboot

6. 配置免密登录

ssh-keygen（回车之后，再根据三次提示直接按三次回车键）

ssh-copy-id主机名（回车之后，输入一次yes，然后在输入一次密码）

测试是否免密成功：ssh hadoop01

如果不需要密码，那么说明免密成功，那么输入logout

7. 上传或者下载hadoop

进入/home/software目录，来上传或者下载Hadoop。

cd /home/software/

8. 解压Hadoop安装包

tar -xvf hadoop-3.1.3.tar.gz

9. 进入Hadoop的配置文件目录

cd hadoop-3.1.3/etc/hadoop/

10. 编辑文件

vim hadoop-env.sh

在文件中添加JAVA_HOME，值是JDK的安装路径

export JAVA_HOME=/home/software/jdk1.8

保存退出，重新生效这个文件

source hadoop-env.sh

11. 编辑文件

vim core-site.xml

添加内容

<name>fs.default.name</name>

<value>hdfs://hadoop01:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/software/hadoop-3.1.3/tmp</value>

</property>

12. 编辑文件

vim hdfs-site.xml

添加内容

<name>dfs.replication</name>

</property>

13. 编辑文件

vim mapred-site.xml

添加内容

<name>mapreduce.framework.name</name>

</property>

14. 编辑文件

vim yarn-site.xml

添加内容

<name>yarn.resourcemanager.hostname</name>

<value>hadoop01</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

15. 编辑文件

vim workers ------- 注意，如果是在Hadoop2.X，那么这个文件是slaves

将原来的localhost删除掉，然后添加当前主机的主机名

16. 配置环境变量

vim /etc/profile

在文件末尾添加

export HADOOP_HOME=/home/software/hadoop-3.1.3

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存退出，重新生效这个文件

source /etc/profile

通过hadoop version命令来确定配置是否有效

17. 第一次启动Hadoop之前，需要先进行一次格式化

hadoop namenode -format

如果出现了Storage directory /home/software/hadoop-3.1.3/tmp/dfs/name has been successfully formatted.表示格式化成功

18. 进入Hadoop安装目录的子目录sbin下

cd /home/software/hadoop-3.1.3/sbin/

19. 编辑文件

vim start-dfs.sh

在文件头部添加

HDFS_DATANODE_USER=root

HDFS_DATANODE_SECURE_USER=hdfs

HDFS_NAMENODE_USER=root

HDFS_SECONDARYNAMENODE_USER=root

20. 启动HDFS

start-dfs.sh

21. 通过jps查看，会发现三个进程

NameNode

DataNode

SecondaryNameNode

22. 编辑文件

vim start-yarn.sh

在文件头部添加

YARN_RESOURCEMANAGER_USER=root

HDFS_DATANODE_SECURE_USER=hdfs

YARN_NODEMANAGER_USER=root

23. 启动YARN

start-yarn.sh

24. 通过jps查看，会发现多出来两个进程

ResourceManager

NodeManager

25. 在第一次关闭Hadoop之前，同样修改stop-dfs.sh以及stop-yarn.sh

stop-dfs.sh的修改内容同第19条。
stop-yarn.sh的修改内容同第22条。
之后，再次启动Hadoop，那么可以使用start-all.sh。如果单独启动HDFS，那么使用start-dfs.sh；如果单独启动YAR，那么使用start-yarn.sh。如果要关闭，将start命令改成stop命令即可

26. 可能出现的问题的解决方案

1. 如果出现了Name or Service not known或者是UnknownHost之类的问题，那么检查hosts文件是否配置正确，或者是主机名是否写对

2. 如果出现了commandc not found，那么检查环境变量是否正确，或者修改完环境变量之后是否进行了source

查看namenode节点状态

hdfs haadmin -getServiceState nn1

标签：文件,Hadoop,hadoop,主机名,sh,vim,安装,分布式
From： https://blog.51cto.com/u_16004326/6412771

【获奖案例巡展】信创先锋之星——江西金发基于分布式数据库的互联网金融业务系统
为表彰使用大数据、人工智能等基础软件为企业、行业或世界做出杰出贡献和巨大创新的标杆项目，星环科技自2021年推出了“新科技星力量”星环科技科技实践案例评选活动，旨在为各行业提供更多的优秀产品案例，彰显技术改变世界的力量，目前已成功举办两届，收到了来自各界的积极参与。第二......
安装k8s 时报错No package kubelet-1.20.9 available.
报错信息：[root@vm~]#sudoyuminstall-ykubelet-1.20.9kubeadm-1.20.9kubectl-1.20.9--disableexcludes=kubernetesLoadedplugins:fastestmirrorLoadingmirrorspeedsfromcachedhostfileepel:mirror-icn.yuki.net.ukNopackagekubelet-1.20.9available.No......
git-简介、安装和配置
前言项目的开发是一个不断更新、迭代的过程，开发的过程中程序员需要不断的对代码进行编写和更正。这就会带来很多问题。开发中代码会存在多个版本，我们如何将代码在多个版本之间进行切换？代码上线后，如何在不影响现行开发工作的情况下对代码进行维护？开发时某段代码被多人修改时，如......
Ubuntu22.04 安装 java JDK
0前言1下载jdk2.配置环境变量（只修改用户配置）参考0前言Linux一般使用openjdk,其主要由Oracle提供，部分源码不可见一般学习以jdk8为基础.以下教程为jdk8的Linux-Ubuntu的安装教程1下载jdkOracle网站：https://www.oracle.com/java/technologies/downloads/#java8下载后......
ABBYY FineReader PDF 16安装教程使用指南及ABBYY16系统配置要求
本文转载于：https://blog.csdn.net/weixin_55412152/article/details/131030190近年来，随着盲人数字阅读的普及推广，PDF格式的电子书越来越受到大家的关注和喜爱，但受读屏软件功能的限制，扫描版的PDF电子书是无法直接阅读的，这就需要将其转换为可阅读的文档格式，可对于大多数视障读者来说，......
银河麒麟服务器V10 SP3 安装ZooKeeperZookeeper 图形化的客户端工具（ZooInspector）
服务器zookeeper安装一、软件介绍1、ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。2、ZooKeeper的原理......
银河麒麟V10 SP３下安装部署GeoServer地图服务
一、环境JDK:Java1.8.0_361TomcT:ApacheTomcat/9.0.33GeoServer:geoserver-2.11.0二、安装部署1.确保在系统上安装了JavaRuntimeEnvironment（JRE）。GeoServer需要Java8或Java11环境，可从OpenJDK，AdoptOpenJDK获得或由您的OS发行版提供。[root@localhost~]#yuminstalljava-1.8......
银河麒麟KylinV10安装FastDFS单机版与FastDFS集群搭建
一、FastDFS介绍1.1.简介FastDFS是一个开源的轻量级分布式文件系统，它对文件进行管理，功能包括：文件存储、文件同步、文件访问（文件上传、文件下载）等，解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务，如相册网站、视频网站等等。FastDFS为互联网量身定制，充分考虑了冗......
node.js安装及环境配置教程【Windows系统安装包方式】
一、下载安装包：https://nodejs.org/zh-cn/download/注：根据自己电脑系统及位数选择，我的电脑是Windows系统、64位、想下载稳定版的.msi（LTS为长期稳定版）这里选择windows64位.msi格式安装包。.msi和.zip格式区别：.msi是Windowsinstaller开发出来的程序安装文件，它可以让你安装，修改，......
python环境 anaconda安装
官网：https://www.anaconda.com/distribution/#macos国内镜像：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/安装时注意勾选：安装后，加入国内源：condaconfig--addchannelshttps://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/condaconfig--setshow_cha......

Hadoop伪分布式安装