首页 > 系统相关 >VMware搭建Hadoop集群 for Windows(完整详细,实测可用)

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)

时间:2023-08-10 17:01:17浏览次数:55  
标签:etc Windows 虚拟机 配置 Hadoop hadoop03 export hadoop01 VMware


目录

一、VMware 虚拟机安装

(1)虚拟机创建及配置 

(2)创建工作文件夹

二、克隆虚拟机

三、配置虚拟机的网络

(1)虚拟网络配置

(2)配置虚拟机 主机名

(3)配置虚拟机hosts

(4)配置DNS、网关等

(5)reboot 重启虚拟机

四、配置SSH服务

(1)确认ssh进程 

(2)生成秘钥

(3)秘钥拷贝

 五、JDK安装

(1)把JDK安装包传输到虚拟机

(2)把JDK安装包解压到/export/software/

(3)配置JDK环境变量

六、Hadoop安装

(1)安装包上传及解压

(2)Hadoop系统环境配置 

(3)Hadoop集群境配置 

3.1 修改hadoop-env.sh文件

3.2 修改core-site.xml文件

3.3 修改hdfs-site.xml文件

3.4 修改mapred-site.xml文件

3.5 修改yarn-site.xml文件

3.6 修改workers文件

(4)将集群主节点的配置文件分发到其他子节点

(5)格式化文件系统

(6)集群启动

七、浏览器查看Hadoop集群

(1)修改windows下ip映射

(2)防火墙关闭

(3)浏览器查看


一、VMware 虚拟机安装


(1)虚拟机创建及配置 

VMware下载地址

VMware的安装过程比较简单,正常安装就行,打开后是以下页面:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式

 点击文件==》新建虚拟机

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_02

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_03

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_04

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_05

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_06

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_07

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_08

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_09

 这里选择提前下载好的CentOS镜像:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_10

 点击开启此虚拟机

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_11

 Enter回车,开始安装CentOS镜像:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_12

 选择语言:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_13

 设置日期:

 安装位置点进去,点击完成:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_14

 KDUMP禁用:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_15

 网络和主机名:

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_16

 点击开始安装:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_17

 设置密码

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_18

这里要是密码设置过于简单,点击两次完成即可,后面就会继续执行安装了,等待执行完成,店点击重启按钮,重启后进入一下界面:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_19

输入root和密码之后进入虚拟机:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_20

(2)创建工作文件夹

在hadoop01上执行:

mkdir -p /export/data
mkdir -p /export/servers
mkdir -p /export/software

二、克隆虚拟机

搭建集群需要3个虚拟机,hadoop01,hadoop02,hadoop03,已经安装了hadoop01,剩下两个需要用到虚拟机克隆。

先关闭hadoop01虚拟机:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_21

 点击克隆

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_22

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_23

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_24

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_25

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_26

 同理,克隆出hadoop03即可,到这虚拟机创建及配置完毕。

三、配置虚拟机的网络

三台虚拟机的ip和域名映射关系如下:

192.168.121.221 hadoop01

192.168.121.222 hadoop02

192.168.121.223 hadoop03

(1)虚拟网络配置

打开虚拟网络编辑器:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_27

选择VMnet8 

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_28

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_29

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_30

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_31

 之后点击确定即可。

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_32

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_33

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_34

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_35

(2)配置虚拟机 主机名

在hadoop01虚拟机下执行: 

vi /etc/hostname

vi的insert、save等基本操作参考:

修改后如下: 

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_36

 同理修改hadoop02和hadoop03的hostname为 hadoop02 和 hadoop03,原因是hadoop02和hadoop03是由hadoop01克隆来的,不修改的话,hostname都是hadoop01,修改后如下:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_37

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_38

(3)配置虚拟机hosts

 其实就是配置ip和域名的映射关系。

vi /etc/hosts

上面的命令编辑hosts,在3个虚拟机都里面添加:

192.168.121.221 hadoop01

192.168.121.222 hadoop02

192.168.121.223 hadoop03

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_39

(4)配置DNS、网关等

在3个虚拟机下新增以下ip设置

IPADDR="192.168.121.221"

NETMASK="255.255.255.0"

GATEWAY="192.168.121.2"

DNS1="114.114.114.114"

 执行以下命令:

vi  /etc/sysconfig/network-scripts/ifcfg-ens33

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_40

(5)reboot 重启虚拟机

 以上所有配置完成后,执行:

reboot

然后可以验证下网络是否通,出现一下说明配置正常:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_41

四、配置SSH服务

SSH服务的作用一般是有两方面:一是便于虚拟机节点之间免密访问,二是传输数据时会有加解密的过程安全性更高。为了这三个节点间免密登录,比如后面在启动hadoop服务时,主节点启动其它从节点,就需要免密去执行。所以3台机器都执行以下流程,这样三台机器就可以使用ssh连接而无需输入密码了。

(1)确认ssh进程 

输入以下命令,查看ssh进程是否存在(默认是开启的): 

ps -e | grep sshd

如下便是开启状态: 

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_42

(2)生成秘钥

ssh-keygen -t rsa

执行以上命令,不用输入,按3次回车:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_43

(3)秘钥拷贝

三台机器的秘钥分别生成之后,需要将各自的秘钥拷贝到其他2台机器,3台机器都执行以下命令:

ssh-copy-id hadoop01
ssh-copy-id hadoop02
ssh-copy-id hadoop03

每条命令中间会有询问,输入“yes”回车,然后输入密码即可:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_44

验证下ssh配置:

在hadoop01下执行ssh hadoop02 和ssh hadoop03,能成功登录:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_45

 五、JDK安装

下载一个linux版本的JDK,这里是 jdk-8u161-linux-x64.tar.gz,3台机器均要执行以下。

(1)把JDK安装包传输到虚拟机

这里我们需要借助ftcp文件传输软件,这里使用的是MobaxTerm,也可以使用别的文件传输软件,WinSCP\PuTTY\Xshell都可以。

MobaxTerm新建SFTP类型的session:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_46

 可以新建一个root用户,把3个虚拟机的密码输入:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_47

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_48

点击ok后:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_49

 选择jdk文件,拖入之前建好的/export/software文件夹:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_50

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_51

(2)把JDK安装包解压到/export/software/

执行以下命令:

cd /export/software/
tar -zxvf jdk-8u161-linux-x64.tar.gz -C /export/servers/
cd /export/servers/
mv jdk1.8.0_161/ jdk

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_52

(3)配置JDK环境变量

执行:

vim /etc/profile

在文末添加:

export JAVA_HOME=/export/servers/jdk

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_53

注意:

修改  /etc/profile 文件最后都要执行下 

source /etc/profile

才能是修改生效。最后执行java -version看下是否配置成功。

六、Hadoop安装

 Hadoop下载地址

这里使用的是 hadoop-3.1.3.tar.gz

(1)安装包上传及解压

跟前面JDK一样,先用 mobaxterm 将 hadoop-3.1.3.tar.gz 上传到3台机器的 /export/software:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_54

执行下面解压命令:

tar -zxvf hadoop-3.1.3.tar.gz -C /export/servers/

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_55

(2)Hadoop系统环境配置 

执行:

vim /etc/profile

添加一下内容:

export HADOOP_HOME=/export/servers/hadoop-3.1.3

export PATH=:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export HDFS_NAMENODE_USER=root

export HDFS_DATANODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_56

 一样,修改  /etc/profile 文件最后都要执行下 “vim /etc/profile”。

执行验证下:

hadoop version

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_57

(3)Hadoop集群境配置 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_58

3.1 修改hadoop-env.sh文件

执行:

cd /export/servers/hadoop-3.1.3/etc/hadoop
vim hadoop-env.sh

找到export JAVA_HOME的位置修改:

export JAVA_HOME=/export/servers/jdk

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_59

3.2 修改core-site.xml文件

vim core-site.xml

添加以下配置:

<configuration>

       <property>

              <name>fs.defaultFS</name>

              <value>hdfs://hadoop01:9000</value>

       </property>

       <property>

              <name>hadoop.tmp.dir</name>

              <value>/export/servers/hadoop-3.1.3/tmp</value>

       </property>

</configuration>

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_60

 hadoop02、hadoop03修改时,把对于域名修改成hadoop02、hadoop03即可。

3.3 修改hdfs-site.xml文件

vim hdfs-site.xml

添加以下配置:

<configuration>

       <property>

              <name>dfs.replication</name>

              <value>3</value>

       </property>

       <property>

              <name>dfs.namenode.secondary.http-address</name>

              <value>hadoop02:50090</value>

       </property>

</configuration>

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_61

dfs.namenode.secondary.http-address这配置在hadoop02、hadoop03不用配置。

3.4 修改mapred-site.xml文件

vim mapred-site.xml

添加以下配置:

<configuration>

<!-- 指定MapReduce运行时框架,这里指定在Yarn上,默认是local -->

       <property>

              <name>mapreduce.framework.name</name>

              <value>yarn</value>

       </property>start

</configuration>

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_62

3.5 修改yarn-site.xml文件

vi yarn-site.xml

添加以下配置:

<configuration>

   <property>

              <name>yarn.resourcemanager.hostname</name>

              <value>hadoop01</value>

       </property>

       <property>

              <name>yarn.nodemanager.aux-services</name>

              <value>mapreduce_shuffle</value>

       </property>

</configuration>

另外,需要执行下:

hadoop classpath

 将返回的地址也写入配置文件:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_63

3.6 修改workers文件

vim workers

删除默认的localhost,添加以下内容: 

hadoop01

hadoop02

hadoop03

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_64

(4)将集群主节点的配置文件分发到其他子节点

执行:

scp /etc/profile hadoop02:/etc/profile
scp /etc/profile hadoop03:/etc/profile
scp -r /export/ hadoop02:/
scp -r /export/ hadoop03:/

传完之后要在hadoop02和hadoop03上分别执行 source /etc/profile 命令。

(5)格式化文件系统

hdfs namenode -format

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_65

这个执行成功以后,不要二次执行。

(6)集群启动

执行:

start-dfs.sh

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_66

  

然后3个机器分别 jps 查看进程情况:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_67

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_分布式_68

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_69

在主节点hadoop01上执行

start-yarn.sh

 启动resourcemanager和nodemanager:

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_70

 jps:

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_71

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_72

 

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_Hadoop_73

 如果想要关闭,输入:

stop-dfs.sh

以上hadoop安装配置就完成了。

七、浏览器查看Hadoop集群

(1)修改windows下ip映射

修改 C:\Windows\System32\drivers\etc下的hosts文件,添加以下内容:

192.168.121.221 hadoop01

192.168.121.222 hadoop02

192.168.121.223 hadoop03

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_大数据_74

 这样就可以通过hadoop01、hadoop02、hadoop03这样的域名来访问了。

(2)防火墙关闭

在3台虚拟机上均执行以下命令(一个是临时关闭,一个是开机就关闭即永久关闭,两个命令执行其中一个即可):

systemctl stop firewalld.service
systemctl disable firewalld.service

(3)浏览器查看

在浏览器输入:

http://hadoop01:9870

http://hadoop01:8088

即可访问 HDFS 和 Yarn

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vim_75

VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_hadoop_76

以上已经将Hadoop集群搭建完毕!

标签:etc,Windows,虚拟机,配置,Hadoop,hadoop03,export,hadoop01,VMware
From: https://blog.51cto.com/u_15697790/7037616

相关文章

  • Windows 10的IIS中设置虚拟目录后无法打开浏览
    问题使用Windows10的IIS架设服务器,配置中设置了虚拟目录后,浏览时出现以下服务器报错内容:点击“编辑虚拟目录”窗口中的“测试设置”,发现“授权”报错:服务器配置为将传递身份验证和内置帐户一起使用,以访问指定的物理路径。但是,IIS管理器无法验证此内置帐户是否有访问权。请......
  • linux连接Windows上的数据库
    /*定义一些数据库连接需要的宏*/#include<stdio.h>#include<string.h>#include<stdlib.h>/*引入连接Mysql的头文件*/#include<mysql/mysql.h>#defineHOST"Linux的IP地址"/*MySql服务器地址*/#defineUSERNAME"root"/*用户名*/#definePASSWORD&......
  • Windows11安装python模块transformers报错Long Path处理
    Windows11安装python模块transformers报错,报错信息如下ERROR:CouldnotinstallpackagesduetoanOSError:[Errno2]Nosuchfileordirectory:'C:\\Users\\27467\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\\LocalCac......
  • Node Sass错误问题 Node Sass could not find a binding for your current environmen
    Modulebuildfailed(from./node_modules/sass-loader/dist/cjs.js):Error:MissingbindingD:\2@Html\vue_work_room\blsh-student-view\node_modules\node-sass\vendor\win32-x64-83\binding.nodeNodeSasscouldnotfindabindingforyourcurrentenviron......
  • 基于Field_II_ver_3_24_windows_gcc工具箱的超声波二维成像与三维成像matlab仿真
    1.算法理论概述1.1超声波成像的基本原理       超声波成像是一种通过超声波对物体进行成像的技术。超声波成像的原理是利用超声波在不同组织之间传播速度不同的特点,探测物体内部的结构。超声波成像可以分为二维成像和三维成像两种。二维成像是将超声波探头沿一个方向......
  • 这些命令可以直接在Windows资源管理器的地址栏中输入,或通过运行对话框(Win + R)中输入运
    Windowsshell命令和路径:shell:commonstartup:该命令用于打开"公共启动"文件夹,这是一个用于存放所有计算机用户启动项的文件夹。在这个文件夹中放置的程序或快捷方式会在每个用户登录时自动执行。shell:sendto:这个命令用于打开"发送到"菜单的文件夹,它包含了在右键菜单中"发送到"......
  • hadoop的相关启动
    1、先退回到hadoop主路径(也就是我上一篇中的hadoop-3.0.0)cd../..2、启动服务命令start-all.sh3、输入jps判断是否启动成功启动成功啦!......
  • redis for windows 6/7安装包定时弹黑窗口解决办法
    这是冰河之刃渡桥计划的一部分,使用Windows计划任务自动运行redis服务。 博客地址:https://www.cnblogs.com/binghe021 下载地址:码云 https://gitee.com/binghe021/redis-setupgithub  https://github.com/binghe021/redis-setup安装包的实现原理是借助计划任务来自动运行redis......
  • 5--windows命令
    ifconfig/all获取域名、IP地址、DHCP服务器、网关、MAC地址、主机名nettime/domain查看域名、时间netview/domain查看域内所有共享netviewip查看对方局域网内开启了哪些共享netconfigworkstation查看域名、机器名等netuser用户名密码/add建立用户netuser用户......
  • 在Windows环境下安装Maven
    在Windows环境下安装MavenMaven是一个项目架包管理工具,其核心思想是:约定大于配置下载Maven官网:https://maven.apache.org/Binary //编译好的二进制文件Source //源代码文件这里下载编译好的zip文件,下载完毕后解压到自己熟悉的路径中。配置环境变量配置maven系统变......