首页 > 系统相关 >windows下安装和配置hadoop

windows下安装和配置hadoop

时间:2023-09-21 15:11:09浏览次数:43  
标签:windows cmd hadoop yarn 3.2 报错 安装 dir

1.安装hadoop

下载hadoop,下载地址:

https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 建议不要下载最高版本,而是下载稳定版本,我下载的是3.2.3版本;将压缩包解压到安装目录,注意安装目录的路径中不要有空格; 我将hadoop压缩包解压到D:\ruanjian\hadoop路径下,解压后hadoop的目录是D:\ruanjian\hadoop\hadoop-3.2.3; 然后下载winutils,在github上可以找到: https://github.com/cdarlint/winutils 找到winutils中对应hadoop版本的文件夹,我的安装版本是3.2.2,将winutils下名为3.2.2文件夹中的文件,复制到hadoop安装目录下的bin文件夹中,替换所有同名的文件; 在环境变量中加入HADOOP_HOME,路径为D:\hadoop\hadoop-3.2.2,并在path中加入%HADOOP_HOME%\bin和%HADOOP_HOME%\sbin; 跟安装java检查环境变量是否配置正确类似,可以在cmd中输入hadoop version,检查hadoop环境变量配置是否正确;   3.配置hadoop hadoop的主要配置在安装目录中etc/hadoop目录下; (1)修改core-site.xml 其中第一个property,hadoop.tmp.dir配置的是保存数据的临时路径,在hadoop安装路径下新建data文件夹,value配置为/D:/hadoop/hadoop-3.2.2/data,注意路径前加了一个'/'; fs.defaultFS配置的是hdfs的ip和端口号,因为安装在本地,ip配置为localhost,端口配置为9000; 复制代码
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
      <name>hadoop.tmp.dir</name>
      <value>/D:/hadoop/hadoop-3.2.2/data</value>
    </property>
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://localhost:9000</value>
    </property>
</configuration>
复制代码

 

(2)修改hadoop-env.cmd 其中JAVA_HOME默认配置为%JAVA_HOME%,可以按实际情况修改;
set JAVA_HOME=%JAVA_HOME%

 

(3)修改hdfs-site.xml 其中dfs.replication是数据库的副本数,默认为3; dfs.namenode.name.dir是DFS名称节点在本地文件系统中存储名称表(fsimage)的位置; dfs.datanode.data.dir是DFS数据节点在本地文件系统中的位置; 复制代码
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/D:/hadoop/hadoop-3.2.2/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/D:/hadoop/hadoop-3.2.2/data/datanode</value>
    </property>
</configuration>
复制代码

 

(3)修改mapred-site.xml 其中mapreduce.framework.name是指定执行mapreduce作业时使用的框架,可以配置local、classic、yarn,我这里配置的是yarn; 复制代码
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
     <property>
            <name>mapreduce.framework.name</name>
             <value>yarn</value>
    </property>
</configuration>
复制代码

 

(4)修改yarn-site.xml 其中yarn.nodemanager.aux-services用于指定在进行mapreduce作业时,yarn使用mapreduce_shuffle混洗技术; yarn.nodemanager.aux-services.mapreduce.shuffle.class用于指定混洗技术对应的字节码文件; 复制代码
<?xml version="1.0"?>
<configuration>
     <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hahoop.mapred.ShuffleHandler</value>
    </property>
</configuration>
复制代码

 

 

4.节点格式化 正常情况下,格式话结束会显示'namenode has been successfully formated',如果格式话失败,原因可能是环境变量配置问题、hadoop版本和winutils版本不一致、etc中配置错误;
hdfs namenode -format

 

 

5.启动hadoop 以管理员身份打开cmd,使用win+r快捷键打开运行,输入cmd,然后ctrl+shift+enter,选择‘是’,打开cmd; 执行start-all.cmd,会新打开4个cmd,分别是namenode、resourcemanager、nodemanager、datanode的4个进程,如果这4个cmd启动没有报错,则启动成功;     6.访问hadoop服务网页   访问集群节点: http://localhost:8088/   访问HDFS: http://localhost:9870/     7.启动hadoop遇到的报错和解决方法   报错1:  java.lang.NoClassDefFoundError: org/apache/hadoop/yarn/server/timelineservice/collector/TimelineCollectorManager   解决方法: 将<hadoop安装目录>\share\hadoop\yarn\timelineservice\hadoop-yarn-server-timelineservice-3.1.4.jar复制到<hadoop安装目录>\share\hadoop\yarn\下一份     报错2: Permissions incorrectly set for dir ... should be rwxr-xr-x, actual value = rw-rw-rw-   解决方法: 执行节点格式化语句(hdfs namenode -format)后,会在C盘tmp下生成hadoop-yarn-...的文件夹,删除这个文件夹后重新运行hadoop     报错3: org.apache.hadoop.yarn.exceptions.YarnRuntimeException: Failed to setup local dir ... /nm-local-dir, which was marked as good.   解决方法: 使用管理员权限运行cmd     报错4: util.SysInfoWindows: ExitCodeException exitCode=-1073741515   解决方法: 运行hadoop安装目录bin下的winutils.exe,查看报错,根据报错内容解决具体问题  

标签:windows,cmd,hadoop,yarn,3.2,报错,安装,dir
From: https://www.cnblogs.com/wjjcjj/p/17720017.html

相关文章

  • windows下操作静态库lib(相当于linux下的ar命令)
    linux下有ar可以操作.a文件,windows下提供了lib.exe操作lib文件,从vs的控制台编译环境中可以直接调用。主要有一下几个操作:列出obj::lib/listxxx.lib释放obj:lib/extract:xxx.obj/out:new.objxxx.lib删除obj:lib/remove:xxx.objxxx.lib增加obj:libxxx.objxxx.lib ......
  • CentOS 7.0系统安装配置步骤详解
    CentOS7.0系统是一个很新的版本哦,很多朋友都不知道CentOS7.0系统是怎么去安装配置的哦,因为centos7.0与以前版本是有很大的改进哦。说明:截止目前CentOS 7.x最新版本为CentOS7.0,下面介绍CentOS7.0的具体安装配置过程服务器相关设置如下:......
  • MySQL压缩包安装问题记录Can't connect to MySQL server on localhost (10061)解决方
    本文章向大家介绍MySQL问题记录--Can'tconnecttoMySQLserveronlocalhost(10061)解决方法,主要包括MySQL问题记录--Can'tconnecttoMySQLserveronlocalhost(10061)解决方法使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下......
  • windows下进程注入的各种技术汇总、代码示例和检测思考
    注入类型                 C++代码实现链接和检测思考         检测优先级           备注PortableExecutableInjection-PE注入 https://www.cnblogs.com/bonelee/p/17719649.html 高 已实现检测,核......
  • 开发工具安装与基本环境配置
    安装链接:https://pan.baidu.com/s/1klgouPWrlGQ7qatqc2PjKA?pwd=6894此链接已包含Python,Pycharm,MySql,Navicat,VsCode等开发工具与相应的安装教程。Python安装与配置第一步:在分享的百度网盘链接中下载Python安装包,也可以到官网上下载。第二步:双击Python安装包![](https:......
  • nodejs+vue+element-ui安装
    1.nodejs安装https://www.runoob.com/nodejs/nodejs-install-setup.html2.vue安装nodejs安装以后,使用vue会报错:‘vue‘不是内部或外部命令,也不是可运行的程序解决办法:https://developer.aliyun.com/article/1093401配置vue的环境变量:查看到prefix的值以后,分别......
  • Redis安装服务到电脑
    1、直接在地址栏输入cmd回车打开命令窗口,输入redis-serverredis.windows.conf然后回车2、在cmd命令窗口输入以下命令并回车安装Windows本地服务redis-server--service-installredis.windows-service.conf3、常用Redis服务命令(1)开启服务:redis-server--service-st......
  • Qt 安装包制作
    Qt安装包制作新建模板小书匠更新提醒创建一个在线安装包,实现对用户的升级提醒。以下是实现更新提醒的必要步骤:1、将更新内容拷贝到package目录2、在package.xml文件中,为元素增加对应值3、使用repogen工具把更新内容创建为一个在线仓库,并在仓库的根目录生成Updates.xml4......
  • Windows Server 2012 防火墙如何添加端口例外的方法
    WindowsServer2012防火墙如何添加端口例外的方法https://www.cnblogs.com/seasonzone/p/7099726.html常用端口https://www.cnblogs.com/yzgblogs/p/14511256.html......
  • hadoop和hbase节点添加和单独重启
    有时候hadoop或hbase集群运行时间久了后,某些节点就会失效,这个时候如果不想重启整个集群(这种情况在很多情况下已经不被允许),这个时候可以单独重启失效节点。HADOOP:hadoop中重启单节点的方法和增加新节点其实是一样的。1、我们先看下如何了解hadoop机器的情况,可......