首页 > 其他分享 >搭建Hadoop环境

搭建Hadoop环境

时间:2023-09-27 21:24:52浏览次数:29  
标签:opt 命令 环境 hadoop Hadoop etc sh 搭建

搭建Hadoop环境

一、虚拟机的安装

二、 安装JDK

1.下载jdk

wget https://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz

使用上述命令安装

2.执行以下命令,解压下载的JDK1.8安装包。

tar -zxvf openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz

3.执行以下命令,移动并重命名JDK包

mv java-se-8u41-ri/ /usr/java8

4.执行以下命令,配置Java环境变量

echo 'export JAVA_HOME=/usr/java8' >> /etc/profile
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profile
source /etc/profile

5.执行以下命令,查看Java是否成功安装

java -version

image

三、安装Hadoop

1、执行以下命令,下载Hadoop安装包

wget --no-check-certificate https://mirrors.bfsu.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz

2.执行以下命令,解压Hadoop安装包至/opt/hadoop

tar -zxvf hadoop-2.10.1.tar.gz -C /opt/

mv /opt/hadoop-2.10.1 /opt/hadoop

3.执行以下命令,配置Hadoop环境变量。

echo 'export HADOOP_HOME=/opt/hadoop/' >> /etc/profile

echo 'export PATH=$PATH:$HADOOP_HOME/bin' >> /etc/profile

echo 'export PATH=$PATH:$HADOOP_HOME/sbin' >> /etc/profile

source /etc/profile

4.执行以下命令,修改配置文件yarn-env.sh和hadoop-env.sh

echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/yarn-env.sh

echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/hadoop-env.sh

5.执行以下命令,测试Hadoop是否安装成功

hadoop version

image

四、配置Hadoop

1.修改Hadoop配置文件 core-site.xml

vim /opt/hadoop/etc/hadoop/core-site.xml

输入i进入编辑模式。

节点内插入如下内容

<property>

<name>hadoop.tmp.dir</name> <value>file:/opt/hadoop/tmp</value>

<description>location to store temporary files</description> </property>

<property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

按Esc键退出编辑模式,输入:wq保存退出

2.修改Hadoop配置文件 hdfs-site.xml

vim /opt/hadoop/etc/hadoop/hdfs-site.xml

重复上述操作

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.namenode.name.dir</name> <value>file:/opt/hadoop/tmp/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name> <value>file:/opt/hadoop/tmp/dfs/data</value>

</property>

五、配置SSH免密登录

1、执行以下命令,创建公钥和私钥

ssh-keygen -t rsa

image

都是直接回车,不需要输入别的

2.执行以下命令,将公钥添加到authorized_keys文件中

cd .ssh

cat id_rsa.pub >> authorized_keys

六、启动Hadoop

1、执行以下命令,初始化namenode

hadoop namenode -format

需要输入YES

2.依次执行以下命令,启动Hadoop

start-dfs.sh

image

start-yarn.sh

image

3.启动成功后,执行以下命令,查看已成功启动的进程

jps

image

4.打开浏览器访问http://ip:8088

如果未启动成功

出现

image

说明ssh未安装,或者未启动,还有可能为防火墙未关闭

这个错误表示您无法通过SSH连接到本地主机。常见原因包括SSH服务器未运行、端口被阻止或系统设置问题。

请确保您已经安装了SSH服务器,并且服务正在运行。您可以使用以下命令检查SSH服务器的状态:

sudo service ssh status

如果服务未运行,可以使用以下命令启动SSH服务器:

sudo service ssh start

另外,请确保防火墙没有禁止SSH连接。您可以尝试暂时停用防火墙来测试连接:

sudo ufw disable

然后继续执行

start-dfs.sh

start-yarn.sh

jps

标签:opt,命令,环境,hadoop,Hadoop,etc,sh,搭建
From: https://www.cnblogs.com/zx-demo/p/17734357.html

相关文章

  • 【Python进阶-PyQt5】00搭建PyQt5环境
    1.创建独立开发虚拟环境1.1虚拟环境简介我们编写的程序,有时用到的Python库是不一样的,比如说开发桌面应用程序我们主要用到PyQt5相关的Python库、开发Web应用程序我们主要用到Django相关的Python库等等。假设我们在开发桌面应用程序的时候除了PyQt5相关的Python库外,还附加了其他......
  • 兼顾集群与个人实践环境,和鲸聚焦 AI4S 科研算力高效调度管理
    随着人类社会进入信息时代的智能化阶段,数据逐渐成为基础生产要素之一,而算力也因此成为重要生产力。《学习时报》9月3日发文《算力为何如此重要》,文中指出,人工智能技术的突破与产业数字化应用对算力提出了更高的要求;在9月20日的华为全联接大会上,孟晚舟也演讲表示,算力是人工智......
  • 配java环境在linux上,cuda9.2 old version
    主要参考:https://blog.csdn.net/m0_62946761/article/details/127138742先打个标记#CUDA10.2pipinstalltorch==1.6.0torchvision==0.7.0#CUDA10.1pipinstalltorch==1.6.0+cu101torchvision==0.7.0+cu101-fhttps://download.pytorch.org/whl/torch_stable.html#C......
  • 接口自动化--postman(3)高级用法,全局变量和环境变量
    Postman提供了GUI界面的变量管理窗口,可以管理全局变量和环境变量全局变量:整个Postman都能使用的变量环境变量:选中环境后,才会全局生效的变量,叫做环境变量环境变量作用:可以通过变量进行参数化,方便集中管理测试数据;同时环境变量还可以起到快速切换环境的作用。Postman界面......
  • .NET Core|--调用C++库|--LibraryImport docker环境下,处理依赖问题--GCC--Docker
    前言万恶之源在于,C#程序中需要调用C++的一个函数库,在Windows环境下,只要保证引用的相关dll存在,就是ok的,但是在Linux环境下,并且我的Webapi程序是部署在docker中的,问题就比较麻烦一些.经历了新建软链接,缺失".so"文件,有了".so"文件后,版本错误:libstdc++.so.......
  • spark环境部署之wordCount初体验
    一.安装spark1.1下载并解压官方下载地址:http://spark.apache.org/downloads.html,选择Spark版本和对应的Hadoop版本后再下载:解压安装包#tar-zxvfspark-2.2.3-bin-hadoop2.6.tgz1.2配置环境变量vim/etc/profileexportSPARK_HOME=/usr/app/spark-2.2.3-bin-......
  • ArcGIS Pro 3创建Python环境失败的解决方法
    当使用ArcGISPro的包管理器创建新的Python环境时,遇到以下错误提示,无法成功创建。permissionError:[Errno13]Permissiondenied:'C:\\ProgramFiles\\ArcGIS\\Pro\\bin\\Python\\envs\\arcgispro-py3\\etc\\jupyter\\jupyter_notebook_config.json'解决方法:重启ArcGISPro......
  • JDK安装、java环境配置
      JDK是Java语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境,JAVA工具和JAVA基础的类库。JRE(JavaRuntimeEnvironment,Java运行环境),运行JAVA程序所必须的环境的集合,包含JVM标准实现及Java核心类库.它包......
  • Hadoop 1.0.2 安装 使用 单机模式 Hadoop_1
    装完的HDFS用IE打开访问,查看其磁盘使用情况:http://192.168.33.10:50070/dfshealth.jsp step1.为Hadoop增加用户,记住设定的密码 Java代码 1.$sudoaddgrouphadoop2.$sudoadduser--ingrouphadoophduserstep2.ssh的安装与设置 由于Hadoop......
  • 【DevChat】使用bat修改环境变量path的值
    今天尝试使用DevChat插件进行脚本编程,随然没有100%满足我的需求,不过也挺厉害了,具体如下:需求:使用批处理查找环境变量path是否存在BAT_HOME,如果存在则删除,如果不存在则添加方案一:使用setx操作环境变量在Windows系统中,你可以使用以下的批处理脚本来实现你的需求。这个脚本会检查......