Hadoop 一

时间：2022-10-18 20:11:56浏览次数：33

标签：Map 结点 -- Hadoop NameNode 数据

Hadoop要解决的问题：

　　海量数据的存储和计算

Hadoop优势

　　1.高可靠性，Hadoop底层维护多个数据副本，即使某个结点故障，也不会导致数据丢失

　　2.高扩展性：在集群间分配任务数据，方便扩展数以千计的结点（动态增加删除服务器）

　　3.高效性： Hadoop是并行工作的，加快任务处理速度

　　4.高容错性：能够自动将失败的任务重新分配

Hadoop的组成（重点）

　　Hadoop3.x在组成上没有太大变化

HDFS概述：

　　NameNode（nn）：记录每个文件块存储的位置（类似与目录）（文件名，文件目录结构，文件属性，文件权限，文件块列表以及所在的DataNode）

　　DataNode（dn）：具体来存储数据（在本地文件系统存储文件块数据，以及块数据的校验和）

　　Secondary NameNode （2NN）：辅助NameNode工作（每隔一段时间对NameNode的元数据进行备份）

Yarn（ResourceManager--RM和NodeManager--NM）

　　ResourceManager：整个集群的资源管理--内存、CPU等

　　NodeManager：单个结点的资源管理

　　ApplicationMaster：单个任务运行的管理者

　　Container：容器，相当于一个独立的服务器，里面封装任务运行所需要的资源，CPU 内存网络等

　　　多个客户端，集群上可以运行多个APP Master，每个NM上可有多个Container

MapReduce

　　计算过程分为两个阶段：Map和Reduce

　　Map：并行处理输入数据

　　Reduce：对Map阶段的结果进行汇总

HDFS，Yarn，MapReduce三者关系

大数据生态图

标签：Map,结点,--,Hadoop,NameNode,数据
From： https://www.cnblogs.com/zlnfcl/p/16803913.html

hadoop核心-纠删码存储技术
1、纠删码存储技术CDH6主要集成打包了Hadoop3，包括Hadoop3的一些新特性的官方支持，比如纠删码等。纠删码可以将HDFS的存储开销降低约50%，同时与三份副本策略一样，还可以保证数......
Linux 下搭建 Hadoop 环境
Linux下搭建Hadoop环境作者：Grey原文地址：博客园：Linux下搭建Hadoop环境CSDN：Linux下搭建Hadoop环境环境要求操作系统：CentOS7下载地址安装说明需要准备两个......
1_hadoop入门
内容大纲:1.Hadoop架构详解大数据概述大数据发展史 //谷歌的3驾马车Hadoop的分类 //Apache社区版,Cloudera商业版(CDH版)应用场景特点Hadoop的架构图//Hadoop1.X......
hadoop的源码编译
前期准备1.CentOS联网配置CentOS能够连接外网。注意：采用root用户编译，减少文件夹权限出现的问题。2.jar包准备hadoop源码、jdk8、maven、ant、protobuf(1)hadoop-2.7......
Hadoop生态系统—数据仓库Hive的安装
一、数据仓库数据仓库是一个面向主题的、集成的、随时间变化，但信息本身相对稳定的数据集合，相比于传统型数据库，它主要用于支持企业或组织的决策分析处理。主要有以下3个特......
hadoop集群启动脚本文件myhadoop.sh
#!/bin/bashif[$#-lt1]thenecho"NoArgsInput..."exit;ficase$1in"start")echo"===================启动hadoop集群==================="......
Hadoop Yarn
Yarn是Hadoop的资源管理器，它是一个通用的资源管理系统，为上层应用提供统一的资源管理和调度，这里展示一张YARN的官方架构图，各位可以看一下。接下来让我们看看架构......
Hadoop安装
记录第一次搭建Hadoop集群。使用版本：Ubuntu：ubuntu-20.04.5-desktop-amd64.isoHadoop：hadoop-2.7.5.tar.gz对vim的基本命令：进入编辑状态：insert删除：delete退出编辑......
hadoop集群搭建与简单应用
系统镜像:CentOS-6.5-x86_64-Li.iso虚拟机:VMwareWorkstation16Pro(16.0.0build-16894299)JDK:1.8.0_161hadoop:2.7.0创建虚拟机虚拟机安装后将系统install对mas......
Hadoop MapReduce
学习MapReduce，首先要理解它的思想——分而治之，先分再合，分而治之，所谓的分而治之，意思就是将一个复杂的问题，按照一定的分解方法分解为规模较小的若干的部分，再逐个解决，分别找出......

Hadoop 一

相关文章

赞助商

阅读排行