首页 > 其他分享 >Hadoop伪分布式安装

Hadoop伪分布式安装

时间:2023-06-04 23:06:33浏览次数:42  
标签:文件 Hadoop hadoop 主机名 sh vim 安装 分布式

Hadoop伪分布式安装

安装环境:Centos7.5,只少2核4G

提前准备:Linux中要安装JDK8,Zookeeper-3.5.7

1. 关闭防火墙

systemctl stop firewalld

systemctl disable firewalld

2. 修改主机名

Hadoop集群中,主机名中尽量不要出现-或者_

vim /etc/hostname

将原来的主机名删除,添加自己指定的主机名

3. 需要将主机名和IP进行映射

vim /etc/hosts

进入文件之后,除了127.0.0.1以及::1这开头的两行以外,其余的行全部删除

之后添加当前主机的IP 主机名,例如

10.10.153.69 hadoop01

4. 关闭SELINUX

vim /etc/selinux/config

将SELINUX属性的值改为disabled

5. 重启

reboot

6. 配置免密登录

ssh-keygen(回车之后,再根据三次提示直接按三次回车键)

ssh-copy-id主机名(回车之后,输入一次yes,然后在输入一次密码)

测试是否免密成功:ssh hadoop01

如果不需要密码,那么说明免密成功,那么输入logout

7. 上传或者下载hadoop

进入/home/software目录,来上传或者下载Hadoop。

cd /home/software/

8. 解压Hadoop安装包

tar -xvf hadoop-3.1.3.tar.gz

9. 进入Hadoop的配置文件目录

cd hadoop-3.1.3/etc/hadoop/

10. 编辑文件

vim hadoop-env.sh

在文件中添加JAVA_HOME,值是JDK的安装路径

export JAVA_HOME=/home/software/jdk1.8

保存退出,重新生效这个文件

source hadoop-env.sh

11. 编辑文件

vim core-site.xml

添加内容

<property>

<name>fs.default.name</name>

<value>hdfs://hadoop01:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/home/software/hadoop-3.1.3/tmp</value>

</property>

12. 编辑文件

vim hdfs-site.xml

添加内容

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

13. 编辑文件

vim mapred-site.xml

添加内容

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

14. 编辑文件

vim yarn-site.xml

添加内容

<property>

<name>yarn.resourcemanager.hostname</name>

<value>hadoop01</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

15. 编辑文件

vim workers ------- 注意,如果是在Hadoop2.X,那么这个文件是slaves

将原来的localhost删除掉,然后添加当前主机的主机名

16. 配置环境变量

vim /etc/profile

在文件末尾添加

export HADOOP_HOME=/home/software/hadoop-3.1.3

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存退出,重新生效这个文件

source /etc/profile

通过hadoop version命令来确定配置是否有效

17. 第一次启动Hadoop之前,需要先进行一次格式化

hadoop namenode -format

如果出现了Storage directory /home/software/hadoop-3.1.3/tmp/dfs/name has been successfully formatted.表示格式化成功

18. 进入Hadoop安装目录的子目录sbin下

cd /home/software/hadoop-3.1.3/sbin/

19. 编辑文件

vim start-dfs.sh

在文件头部添加

HDFS_DATANODE_USER=root

HDFS_DATANODE_SECURE_USER=hdfs

HDFS_NAMENODE_USER=root

HDFS_SECONDARYNAMENODE_USER=root

20. 启动HDFS

start-dfs.sh

21. 通过jps查看,会发现三个进程

NameNode

DataNode

SecondaryNameNode

22. 编辑文件

vim start-yarn.sh

在文件头部添加

YARN_RESOURCEMANAGER_USER=root

HDFS_DATANODE_SECURE_USER=hdfs

YARN_NODEMANAGER_USER=root

23. 启动YARN

start-yarn.sh

24. 通过jps查看,会发现多出来两个进程

ResourceManager

NodeManager

25. 在第一次关闭Hadoop之前,同样修改stop-dfs.sh以及stop-yarn.sh

  1. stop-dfs.sh的修改内容同第19条。
  2. stop-yarn.sh的修改内容同第22条。
  3. 之后,再次启动Hadoop,那么可以使用start-all.sh。如果单独启动HDFS,那么使用start-dfs.sh;如果单独启动YAR,那么使用start-yarn.sh。如果要关闭,将start命令改成stop命令即可


26. 可能出现的问题的解决方案

1. 如果出现了Name or Service not known或者是UnknownHost之类的问题,那么检查hosts文件是否配置正确,或者是主机名是否写对

2. 如果出现了commandc not found,那么检查环境变量是否正确,或者修改完环境变量之后是否进行了source


查看namenode节点状态

hdfs haadmin -getServiceState nn1

标签:文件,Hadoop,hadoop,主机名,sh,vim,安装,分布式
From: https://blog.51cto.com/u_16004326/6412771

相关文章

  • 【获奖案例巡展】信创先锋之星——江西金发基于分布式数据库的互联网金融业务系统
    为表彰使用大数据、人工智能等基础软件为企业、行业或世界做出杰出贡献和巨大创新的标杆项目,星环科技自2021年推出了“新科技星力量”星环科技科技实践案例评选活动,旨在为各行业提供更多的优秀产品案例,彰显技术改变世界的力量,目前已成功举办两届,收到了来自各界的积极参与。 第二......
  • 安装k8s 时报错No package kubelet-1.20.9 available.
    报错信息:[root@vm~]#sudoyuminstall-ykubelet-1.20.9kubeadm-1.20.9kubectl-1.20.9--disableexcludes=kubernetesLoadedplugins:fastestmirrorLoadingmirrorspeedsfromcachedhostfileepel:mirror-icn.yuki.net.ukNopackagekubelet-1.20.9available.No......
  • git-简介、安装和配置
    前言项目的开发是一个不断更新、迭代的过程,开发的过程中程序员需要不断的对代码进行编写和更正。这就会带来很多问题。开发中代码会存在多个版本,我们如何将代码在多个版本之间进行切换?代码上线后,如何在不影响现行开发工作的情况下对代码进行维护?开发时某段代码被多人修改时,如......
  • Ubuntu22.04 安装 java JDK
    0前言1下载jdk2.配置环境变量(只修改用户配置)参考0前言Linux一般使用openjdk,其主要由Oracle提供,部分源码不可见一般学习以jdk8为基础.以下教程为jdk8的Linux-Ubuntu的安装教程1下载jdkOracle网站:https://www.oracle.com/java/technologies/downloads/#java8下载后......
  • ABBYY FineReader PDF 16安装教程使用指南及ABBYY16系统配置要求
    本文转载于:https://blog.csdn.net/weixin_55412152/article/details/131030190近年来,随着盲人数字阅读的普及推广,PDF格式的电子书越来越受到大家的关注和喜爱,但受读屏软件功能的限制,扫描版的PDF电子书是无法直接阅读的,这就需要将其转换为可阅读的文档格式,可对于大多数视障读者来说,......
  • 银河麒麟服务器V10 SP3 安装ZooKeeperZookeeper 图形化的客户端工具(ZooInspector)
    服务器zookeeper安装一、软件介绍1、ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。2、ZooKeeper的原理......
  • 银河麒麟V10 SP3下安装部署GeoServer地图服务
    一、环境JDK:Java1.8.0_361TomcT:ApacheTomcat/9.0.33GeoServer:geoserver-2.11.0二、安装部署1.确保在系统上安装了JavaRuntimeEnvironment(JRE)。GeoServer需要Java8或Java11环境,可从OpenJDK,AdoptOpenJDK获得或由您的OS发行版提供。[root@localhost~]#yuminstalljava-1.8......
  • 银河麒麟KylinV10安装FastDFS单机版与FastDFS集群搭建
    一、FastDFS介绍1.1.简介FastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。FastDFS为互联网量身定制,充分考虑了冗......
  • node.js安装及环境配置教程【Windows系统安装包方式】
    一、下载安装包:https://nodejs.org/zh-cn/download/注:根据自己电脑系统及位数选择,我的电脑是Windows系统、64位、想下载稳定版的.msi(LTS为长期稳定版)这里选择windows64位.msi格式安装包。.msi和.zip格式区别:.msi是Windowsinstaller开发出来的程序安装文件,它可以让你安装,修改,......
  • python环境 anaconda安装
    官网:https://www.anaconda.com/distribution/#macos国内镜像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/安装时注意勾选:安装后,加入国内源:condaconfig--addchannelshttps://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/condaconfig--setshow_cha......