首页 > 其他分享 >Hadoop入门之组成概述

Hadoop入门之组成概述

时间:2023-06-27 17:44:05浏览次数:40  
标签:储存 入门 结点 Hadoop DataNode NodeManger 概述 NameNode 数据

Hadoop为分布式系统基础结构

多个服务器共同解决一个问题,进行海量数据的储存和海量数据的分析计算

HDFS架构

NameNode:储存文件的元数据,如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块所在的DataNode等

DataNode:在本地文件系统储存文件块数据,以及块数据的校验和

Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份

这里NameNode好比具体数据的目录,记录每个数据储存在哪里以及信息,DataNode好比数据的仓库,储存具体的数据,2nn为秘书,作为NameNode备份,防止数据丢失

类比,DataNode好比一个个盒子储存具体数据,NameNode好比这些盒子的名单,对应每个盒子以及盒子里面储存了什么,2nn为NameNode的备份

YARN架构

yarn是资源协调者,作为hadoop的资源管理器

ResourceManger:主管理者,管理所有资源,内存和cpu为所有NodeManger的总和

NodeManger:单个服务结点的服务器资源管理器

ApplicationMaster:单个任务运行的管理

Container:容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源例如内存,cpu等

说明:客户端可以有多个,集群上可以运行多个ApplicationMaster,每个NodeManger上可以有多个Container

MapRedurce架构

主要作用是海量检索数据

把任务分布给多个hadoop结点服务器,Map阶段

这些结点汇总结果,Reduce阶段

HDFS、YARN和MapReduce的关系

当一个client需要进行查询时,会向RescourceManger提交一个任务,RescourceManger将任务给NodeManger,NodeManger开启一个容器Container里面放一个AppMstr,并且回复RescourceManger告之需要多少的资源,然后找到有对应资源的结点并且开启MapTask,分布任务,然后每个MapTask再汇总返回给用户

标签:储存,入门,结点,Hadoop,DataNode,NodeManger,概述,NameNode,数据
From: https://www.cnblogs.com/liyiyang/p/17509534.html

相关文章

  • CentOS7+java8+hadoop3.3.5环境搭建
    需要的配置文件centos7的镜像centos-7.9.2009-isos-x86_64安装包下载_开源镜像站-阿里云(aliyun.com)java8JavaDownloads|Oraclehadoop3.3.5Indexof/dist/hadoop/common/hadoop-3.3.5(apache.org)步骤首先第一步在本地下载好vmware和centos7的镜像 之后的......
  • ChatGPT从入门到精通,一站式掌握办公自动化/爬虫/数据分析和可视
    课程名称适应人群ChatGPT从入门到精通,一站式掌握办公自动化/爬虫/数据分析和可视全面AI时代就在转角,道路已经铺好了“局外人”or“先行者”就在此刻等你决定1、对ChatGPT感兴趣并希望有人手把手教学的新手2、希望了解GPT各类应用抓住未来风口3、希望提升竞争能力,不被AI淘汰的职场人......
  • Gin快速入门
    参考https://gin-gonic.com/zh-cn/docs/quickstart/安装goget-ugithub.com/gin-gonic/gin引入代码import"github.com/gin-gonic/gin"gomod管理一个新项目#创建新项目mkdirawesomeProjectcdawesomeProject#初始化gomodinit#拉取缺少的模块,移除不用的模块......
  • CMake快速入门
    CMake快速入门目录CMake快速入门1.为什么要使用CMake?2.创建第一个CMake工程3.CMake指令介绍3.1cmake_minimum_required指令3.2project指令3.3set指令3.4message指令3.5add_executable指令3.6add_subdirectory指令3.7add_library指令3.8add_compile_opti......
  • Docker技术架构概述
    1、Docker技术构成Docker软件采用客户-服务(CS架构)的技术架构模式,DockerClient和DockerDaemon交互,DockerDaemon负责创建、运行、发布容器,DockerClient和DockerDaemon可以在同一个系统中,或者DockerClient可以通过RESTAPI远程控制DockerDaemon。DockerCompose负责控制一组应......
  • 使用纯 ABAP 开发 SAP UI5 之一:概述
    abap2UI5是一个开源项目,提供了一种纯ABAP的方法来开发UI5应用程序,无需使用JavaScript、OData和RAP——类似于过去,只需要几行ABAP代码就可以使用选择屏幕和ALV显示输入和表格。该项目设计具有最小的系统占用,并可以在本地和云环境中运行。使用ABAP开发SAPUI5应用的一些优势:......
  • 网安--密码安全概述
     不安全密码1、默认密码路由器默认密码查询:https://www.toolmao.com/baiduapp/routerpwd/2、弱口令弱口令查询网站:https://nordpass.com/most-common-passwords-list/3、已经泄露的密码查询网站:https://haveibeenpwned.com/......
  • 结构型模式概述
    结构型模式描述如何将类或对象按某种布局组成更大的结构。它分为类结构型模式和对象结构型模式,前者采用继承机制来组织接口和类,后者釆用组合或聚合来组合对象。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象结构型模式比类结构型模式具有更大的灵活性。......
  • F5iRules第一期iRules之入门篇
    F5iRules第一期iRules之入门篇测试:Tailf/var/log/ltm......
  • WPF 入门笔记 - 04 - 数据绑定 - 补充内容:资源基础
    宇宙很大,生活更大,也许以后还有缘相见。--三体......