首页 > 其他分享 >华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1

时间:2023-09-24 22:05:54浏览次数:51  
标签:opt 实例 hadoop2.10 Hadoop hadoop etc 耀云 服务器 分布式


文章目录

  • 前言
  • 云耀云服务器L实例简介
  • Hadoop简介
  • 一、配置环境
  • 购买云耀云服务器L实例
  • 查看云耀云服务器L实例状态
  • 重置密码
  • 查看弹性公网IP地址
  • FinalShell连接服务器
  • 二、搭建Hadoop单机版本
  • 详细安装步骤如下:
  • 我们先开始配置java环境
  • hadoop2.x
  • 接下来需要利用vim来操作core-site 和 hdfs-site
  • 踩坑:
  • 三、验证成果
  • 总结


前言

这是Maynor创作的华为云云耀云服务器L实例测评的第二篇,上篇传送门:

华为云云耀云服务器L实例评测|单节点环境下部署ClickHouse21.1.9.41数据库

云耀云服务器L实例简介

云耀云服务器L实例是新一代的轻量应用云服务器,专门为中小企业和开发者打造,提供开箱即用的便利性。云耀云服务器L实例提供丰富且经过严格挑选的应用镜像,可以一键部署应用,极大地简化了客户在云端构建电商网站、Web应用、小程序、学习环境以及各类开发测试等任务的过程。

Hadoop简介

Hadoop是一个开源的分布式计算框架,能够处理大规模数据的存储和处理。它基于Google的MapReduce算法和Google File System(GFS)的思想,可以在廉价的硬件上进行高效的分布式计算。Hadoop有两个核心组件,一个是分布式文件系统Hadoop Distributed File System(HDFS),另一个是分布式计算框架MapReduce。HDFS将大规模数据分散存储在多个节点上,而MapReduce则将计算分散到多个节点上进行并行计算,最终将结果汇总输出。Hadoop的优点是具有高可靠性、可扩展性和高效性,适合处理大规模数据。Hadoop被广泛应用于数据挖掘、机器学习、人工智能、搜索引擎等领域。

一、配置环境

购买云耀云服务器L实例

在云耀云服务器L实例详情页,点击购买。

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_服务器

  • 检查配置,确认购买。

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_运维_02

查看云耀云服务器L实例状态

查看购买的云耀云服务器L实例状态,处在正常运行中。

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_分布式_03

重置密码

重置密码,点击重置密码选项,需要进行身份验证,选择手机验证后,即可重置密码成功。

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_服务器_04

查看弹性公网IP地址

  • 复制弹性公网IP地址,远程连接服务器时使用。

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_服务器_05

FinalShell连接服务器

在FinalShell工具中,填写服务器弹性公网IP地址、账号密码信息,ssh连接远程服务器。

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_运维_06

二、搭建Hadoop单机版本

详细安装步骤如下:

我们先开始配置java环境

首先下载java的jdk

wget https://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_服务器_07

然后解压

tar -zxvf openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_原力计划_08

移动位置并且配置java路径

mv java-se-8u41-ri/ /usr/java8
echo 'export JAVA_HOME=/usr/java8' >> /etc/profile
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profile
source /etc/profile

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_原力计划_09

检查是否安装成功

java -version

这是理想情况,若安装成功会出现如下结果

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_原力计划_10

hadoop2.x
wget --no-check-certificate https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_hadoop_11

tar -zxvf hadoop-2.10.1.tar.gz -C /opt/
mv /opt/hadoop-2.10.1 /opt/hadoop

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_原力计划_12

配置地址

echo 'export HADOOP_HOME=/opt/hadoop/' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/bin' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/sbin' >> /etc/profile
source /etc/profile

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_运维_13

配置yarn和hadoop

echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/yarn-env.sh
echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/hadoop-env.sh

查看Hadoop 安装情况

hadoop version

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_分布式_14

若出现上图情况,则说明安装成功

接下来需要利用vim来操作core-site 和 hdfs-site
vim /opt/hadoop/etc/hadoop/core-site.xml

进入vim环境

按下i(insert)修改

光标移动至configuration之间,复制如下的信息

<property>
        <name>hadoop.tmp.dir</name>
        <value>file:/opt/hadoop/tmp</value>
        <description>location to store temporary files</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_服务器_15

然后按下esc,停止修改,然后打":wq"(实际无“”)退出vim修改

同理操作hdfs-site

vim /opt/hadoop/etc/hadoop/hdfs-site.xml
<property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/data</value>
    </property>

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_原力计划_16

配置master和slave连接,运行如下指令,并且一直回车,直至出现如下图

ssh-keygen -t rsa

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_服务器_17

启动Hadoop

hadoop namenode -format
start-dfs.sh
start-yarn.sh

输入密码

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_hadoop_18

踩坑:
ERROR: but there is no YARN_NODEMANAGER_USER defined. Aborting operation

这里踩了一个小坑,

解决方案:


查看是否配置成功

jps

成功图

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_hadoop_19

三、验证成果

起初HDFS没有文件所以无任何显示

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_原力计划_20

随意上传个文件到HDFS系统中,可以看到系统上有文件

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_运维_21


打开hdfs的web 管理页面 网页ip+50070

华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1_原力计划_22

正常显示!

总结

重点介绍了在云耀云服务器L实例上搭建Hadoop单机版本的步骤。首先购买服务器实例并配置环境,然后安装Hadoop2.x版本并编辑配置文件。在配置过程中可能会遇到问题,需要注意解决。最后验证搭建的Hadoop单机版本是否成功。


标签:opt,实例,hadoop2.10,Hadoop,hadoop,etc,耀云,服务器,分布式
From: https://blog.51cto.com/u_15277063/7588956

相关文章

  • golang 使用redis设置分布式锁 demo
    内容来自对chatgpt的咨询分布式锁是在多个节点上运行的应用程序中协调工作的一种常用方法,而Redis是实现分布式锁的流行选择。以下是使用Go语言和github.com/go-redis/redis库来设置Redis分布式锁的一个简单示例:首先,确保你已经安装了该库:goget-ugithub.com/go-redis/redi......
  • JMeter 分布式集群远程压测及搭建常见问题
    1、JMeter可以在以下场景下使用分布式远程压测:性能测试:JMeter可以模拟大量用户并发访问,进行性能测试。当需要模拟成千上万的用户请求时,单台机器可能无法承受如此大的负载,此时可以使用分布式远程压测来将测试负载分发到多台机器上,提高测试的效率和准确性。稳定性测试:在一段时间......
  • ClickHouse的分布式查询优化
    介绍ClickHouse是一个高性能的列式存储数据库,支持分布式部署。在分布式环境下,如何优化查询性能是一个非常重要的问题。本文将深入探讨ClickHouse的分布式查询优化。分布式查询的挑战在分布式环境下,查询性能的瓶颈通常是网络带宽和节点之间的通信延迟。因此,优化分布式查询的关键......
  • Hadoop是什么? Hadoop是一个由Apache开发的开源分布式计算框架,它能够处理大规模数据并
    Hadoop是什么?Hadoop是一个由Apache开发的开源分布式计算框架,它能够处理大规模数据并行处理任务,支持大规模数据存储和处理。Hadoop的核心组件包括分布式文件系统HDFS和分布式计算框架MapReduce,它们使得Hadoop可以在廉价的硬件上并行地处理大量数据。Hadoop还包括很多相关的项目和子......
  • 分布式基础理论
    分布式基础理论分布式系统简介:“分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统”分布式系统(distributedsystem)是建立在网络之上的软件系统。单一应用架构简介:当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。此时,用于......
  • Hadoop是什么? Hadoop是一个由Apache开发的开源分布式计算框架,它能够处理大规模数据并
    Hadoop是什么?Hadoop是一个由Apache开发的开源分布式计算框架,它能够处理大规模数据并行处理任务,支持大规模数据存储和处理。Hadoop的核心组件包括分布式文件系统HDFS和分布式计算框架MapReduce,它们使得Hadoop可以在廉价的硬件上并行地处理大量数据。Hadoop还包括很多相关的项目和子......
  • 分布式锁
    为什么需要分布式锁?在多线程环境中,如果多个线程同时访问共享资源(例如商品库存、外卖订单),会发生数据竞争,可能会导致出现脏数据或者系统问题,威胁到程序的正常运行。举个例子,假设现在有100个用户参与某个限时秒杀活动,每位用户限购1件商品,且商品的数量只有3个。如果不对共享资......
  • Redis中是如何实现分布式锁的?
    分布式锁常见的三种实现方式:数据库乐观锁;基于Redis的分布式锁;基于ZooKeeper的分布式锁。本次面试考点是,你对Redis使用熟悉吗?Redis中是如何实现分布式锁的。要点Redis要实现分布式锁,以下条件应该得到满足互斥性在任意时刻,只有一个客户端能持有锁。不能死锁客......
  • 什么是分布式系统
    分布式系统是由多个独立计算机或服务器组成的系统,这些计算机或服务器通过网络进行通信和协作,共同完成一个或多个任务。分布式系统的设计目标是提高系统的可靠性、可扩展性、性能和容错性。在分布式系统中,各个计算机或服务器被称为节点,它们可以是物理机器、虚拟机、容器等。这些节......
  • 分布式学习1:GFS
    大家好,我叫黄晓强,我的学号是102101339,个人爱好包括但不限于写小说、画画、制作立体书、魔术、电影等一切有趣的事情,最近在做MIT6.824的分布式实验,这篇随笔是关于google的分布式文件系统GFS的学习笔记master不记录哪些chunkserver拥有特定chunk副本,只在启动时轮询获得该信息,并通......