Hadoop入门之组成概述

时间：2023-06-27 17:44:05浏览次数：41

标签：储存入门结点 Hadoop DataNode NodeManger 概述 NameNode 数据

Hadoop为分布式系统基础结构

多个服务器共同解决一个问题，进行海量数据的储存和海量数据的分析计算

HDFS架构

NameNode:储存文件的元数据，如文件名，文件目录结构，文件属性（生成时间，副本数，文件权限），以及每个文件的块列表和块所在的DataNode等

DataNode:在本地文件系统储存文件块数据，以及块数据的校验和

Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份

这里NameNode好比具体数据的目录，记录每个数据储存在哪里以及信息，DataNode好比数据的仓库，储存具体的数据，2nn为秘书，作为NameNode备份，防止数据丢失

类比，DataNode好比一个个盒子储存具体数据，NameNode好比这些盒子的名单，对应每个盒子以及盒子里面储存了什么,2nn为NameNode的备份

YARN架构

yarn是资源协调者，作为hadoop的资源管理器

ResourceManger:主管理者，管理所有资源，内存和cpu为所有NodeManger的总和

NodeManger:单个服务结点的服务器资源管理器

ApplicationMaster:单个任务运行的管理

Container:容器，相当于一台独立的服务器，里面封装了任务运行所需要的资源例如内存，cpu等

说明:客户端可以有多个，集群上可以运行多个ApplicationMaster，每个NodeManger上可以有多个Container

MapRedurce架构

主要作用是海量检索数据

把任务分布给多个hadoop结点服务器，Map阶段

这些结点汇总结果，Reduce阶段

HDFS、YARN和MapReduce的关系

当一个client需要进行查询时，会向RescourceManger提交一个任务，RescourceManger将任务给NodeManger，NodeManger开启一个容器Container里面放一个AppMstr，并且回复RescourceManger告之需要多少的资源，然后找到有对应资源的结点并且开启MapTask，分布任务，然后每个MapTask再汇总返回给用户

标签：储存,入门,结点,Hadoop,DataNode,NodeManger,概述,NameNode,数据
From： https://www.cnblogs.com/liyiyang/p/17509534.html

CentOS7+java8+hadoop3.3.5环境搭建
需要的配置文件centos7的镜像centos-7.9.2009-isos-x86_64安装包下载_开源镜像站-阿里云(aliyun.com)java8JavaDownloads|Oraclehadoop3.3.5Indexof/dist/hadoop/common/hadoop-3.3.5(apache.org)步骤首先第一步在本地下载好vmware和centos7的镜像之后的......
ChatGPT从入门到精通，一站式掌握办公自动化/爬虫/数据分析和可视
课程名称适应人群ChatGPT从入门到精通，一站式掌握办公自动化/爬虫/数据分析和可视全面AI时代就在转角，道路已经铺好了“局外人”or“先行者”就在此刻等你决定1、对ChatGPT感兴趣并希望有人手把手教学的新手2、希望了解GPT各类应用抓住未来风口3、希望提升竞争能力，不被AI淘汰的职场人......
Gin快速入门
参考https://gin-gonic.com/zh-cn/docs/quickstart/安装goget-ugithub.com/gin-gonic/gin引入代码import"github.com/gin-gonic/gin"gomod管理一个新项目#创建新项目mkdirawesomeProjectcdawesomeProject#初始化gomodinit#拉取缺少的模块，移除不用的模块......
CMake快速入门
CMake快速入门目录CMake快速入门1.为什么要使用CMake?2.创建第一个CMake工程3.CMake指令介绍3.1cmake_minimum_required指令3.2project指令3.3set指令3.4message指令3.5add_executable指令3.6add_subdirectory指令3.7add_library指令3.8add_compile_opti......
Docker技术架构概述
1、Docker技术构成Docker软件采用客户-服务（CS架构）的技术架构模式，DockerClient和DockerDaemon交互，DockerDaemon负责创建、运行、发布容器，DockerClient和DockerDaemon可以在同一个系统中，或者DockerClient可以通过RESTAPI远程控制DockerDaemon。DockerCompose负责控制一组应......
使用纯 ABAP 开发 SAP UI5 之一：概述
abap2UI5是一个开源项目，提供了一种纯ABAP的方法来开发UI5应用程序，无需使用JavaScript、OData和RAP——类似于过去，只需要几行ABAP代码就可以使用选择屏幕和ALV显示输入和表格。该项目设计具有最小的系统占用，并可以在本地和云环境中运行。使用ABAP开发SAPUI5应用的一些优势：......
网安--密码安全概述
不安全密码1、默认密码路由器默认密码查询：https://www.toolmao.com/baiduapp/routerpwd/2、弱口令弱口令查询网站：https://nordpass.com/most-common-passwords-list/3、已经泄露的密码查询网站：https://haveibeenpwned.com/......
结构型模式概述
结构型模式描述如何将类或对象按某种布局组成更大的结构。它分为类结构型模式和对象结构型模式，前者采用继承机制来组织接口和类，后者釆用组合或聚合来组合对象。由于组合关系或聚合关系比继承关系耦合度低，满足“合成复用原则”，所以对象结构型模式比类结构型模式具有更大的灵活性。......
F5iRules第一期iRules之入门篇
F5iRules第一期iRules之入门篇测试：Tailf/var/log/ltm......
WPF 入门笔记 - 04 - 数据绑定 - 补充内容：资源基础
宇宙很大，生活更大，也许以后还有缘相见。--三体......