首页 > 其他分享 >Hadoop 一

Hadoop 一

时间:2022-10-18 20:11:56浏览次数:26  
标签:Map 结点 -- Hadoop NameNode 数据

Hadoop要解决的问题:

  海量数据的存储和计算

 

Hadoop优势

  1.高可靠性,Hadoop底层维护多个数据副本,即使某个结点故障,也不会导致数据丢失

  

  2.高扩展性:在集群间分配任务数据,方便扩展数以千计的结点(动态增加删除服务器)

  3.高效性:  Hadoop是并行工作的,加快任务处理速度

  4.高容错性: 能够自动将失败的任务重新分配

 

 

Hadoop的组成(重点)

  Hadoop3.x在组成上没有太大变化

 

 

 

 HDFS概述:

  NameNode(nn):记录每个文件块存储的位置(类似与目录)(文件名,文件目录结构,文件属性,文件权限,文件块列表以及所在的DataNode)

  DataNode(dn):具体来存储数据(在本地文件系统存储文件块数据,以及块数据的校验和)

  Secondary NameNode (2NN):辅助NameNode工作(每隔一段时间对NameNode的元数据进行备份)

  

 

 

Yarn(ResourceManager--RM和NodeManager--NM)

  ResourceManager:整个集群的资源管理--内存、CPU等

  NodeManager:单个结点的资源管理

  ApplicationMaster:单个任务运行的管理者

  Container:容器,相当于一个独立的服务器,里面封装任务运行所需要的资源,CPU 内存 网络 等

 

 

   

 

   多个客户端,集群上可以运行多个APP Master,每个NM上可有多个Container

  

 MapReduce

  计算过程分为两个阶段:Map和Reduce

  Map:并行处理输入数据

  Reduce:对Map阶段的结果进行汇总

 

 

   

 

 

HDFS,Yarn,MapReduce三者关系

  

 

 

 大数据生态图

  

 

标签:Map,结点,--,Hadoop,NameNode,数据
From: https://www.cnblogs.com/zlnfcl/p/16803913.html

相关文章

  • hadoop核心-纠删码存储技术
    1、纠删码存储技术CDH6主要集成打包了Hadoop3,包括Hadoop3的一些新特性的官方支持,比如纠删码等。纠删码可以将HDFS的存储开销降低约50%,同时与三份副本策略一样,还可以保证数......
  • Linux 下搭建 Hadoop 环境
    Linux下搭建Hadoop环境作者:Grey原文地址:博客园:Linux下搭建Hadoop环境CSDN:Linux下搭建Hadoop环境环境要求操作系统:CentOS7下载地址安装说明需要准备两个......
  • 1_hadoop入门
    内容大纲:1.Hadoop架构详解大数据概述大数据发展史 //谷歌的3驾马车Hadoop的分类 //Apache社区版,Cloudera商业版(CDH版)应用场景特点Hadoop的架构图//Hadoop1.X......
  • hadoop的源码编译
    前期准备1.CentOS联网配置CentOS能够连接外网。注意:采用root用户编译,减少文件夹权限出现的问题。2.jar包准备hadoop源码、jdk8、maven、ant、protobuf(1)hadoop-2.7......
  • Hadoop生态系统—数据仓库Hive的安装
    一、数据仓库数据仓库是一个面向主题的、集成的、随时间变化,但信息本身相对稳定的数据集合,相比于传统型数据库,它主要用于支持企业或组织的决策分析处理。主要有以下3个特......
  • hadoop集群启动脚本文件myhadoop.sh
    #!/bin/bashif[$#-lt1]thenecho"NoArgsInput..."exit;ficase$1in"start")echo"===================启动hadoop集群==================="......
  • Hadoop Yarn
    Yarn是Hadoop的资源管理器,它是一个通用的资源管理系统,为上层应用提供统一的资源管理和调度,这里展示一张YARN的官方架构图,各位可以看一下。   接下来让我们看看架构......
  • Hadoop安装
    记录第一次搭建Hadoop集群。使用版本:Ubuntu:ubuntu-20.04.5-desktop-amd64.isoHadoop:hadoop-2.7.5.tar.gz对vim的基本命令:进入编辑状态:insert删除:delete退出编辑......
  • hadoop集群搭建与简单应用
    系统镜像:CentOS-6.5-x86_64-Li.iso虚拟机:VMwareWorkstation16Pro(16.0.0build-16894299)JDK:1.8.0_161hadoop:2.7.0创建虚拟机虚拟机安装后将系统install对mas......
  • Hadoop MapReduce
    学习MapReduce,首先要理解它的思想——分而治之,先分再合,分而治之,所谓的分而治之,意思就是将一个复杂的问题,按照一定的分解方法分解为规模较小的若干的部分,再逐个解决,分别找出......