首页 > 其他分享 >hadoop学习

hadoop学习

时间:2024-07-13 20:09:24浏览次数:12  
标签:Hadoop MapReduce Yarn hadoop 学习 数据 资源

Hadoop 的优势
高可靠性: Hadoop 底层维护多个数据副本,所以即使 Hadoop 某个计算元素或存储出现故障,也不会导致数据的丢失。
高扩展性: 在集群间分配任务数据,可方便的扩展数以千计的节点。
高效性: 在 MapReduce 的思想下,Hadoop 是并行工作的,以加快任务处理速度。
高容错性: 能够自动将失败的任务重新分配。

Hadoop 1.x 和 hadoop 2.x 的区别

在 Hadoop 1.x 时代,Hadoop 中的 MapReduce 同时处理业务逻辑运算和资源调度,耦合性较大。
在 Hadoop 2.x 时代,增加了 Yarn。Yarn 只负责资源的调度,MapReduce 只负责运算。

HDFS 框架概述

① NameNode(nn): 存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块所在的 DataNode 等。
② DataNode(dn): 在本地文件系统存储文件块数据,以及块数据校验和。
③ Secondary DataNode(2nn): 用来监控 HDFS 状态的辅助后台程序,每隔一段时间获取 HDFS 元数据的快照。

Yarn 结构概述

① ResourceManager(RM):

  (1)处理客户端请求。
  (2)监控 NodeManager。
  (3)启动或监控 ApplicationMaster。
  (4)资源的分配与调度。

② NodeManager(NM):

  (1)管理单个节点上的资源。
  (2)处理来自 ResourceManager 的命令。
  (3)处理来自 ApplicationMaster 的命令。
  (4)资源的分配与调度。

③ ApplicationMaster(AM):

  (1)负责数据的切分。
  (2)为应用程序申请资源并分配给内部的任务。
  (3)任务的监控与容错。

④ Container:

  Container 是 Yarn 中的资源抽象,它封装了某个节点上的多维度资源,如内存、CPU、磁盘、网络等。

MapReduce 架构概述

MapReduce 将计算过程分为两个阶段:Map 阶段和 Reduce 阶段。

① Map 阶段并行处理输入的数据。
② Reduce 阶段对 Map 结果进行汇总。

标签:Hadoop,MapReduce,Yarn,hadoop,学习,数据,资源
From: https://www.cnblogs.com/kongxiangzeng/p/18300613

相关文章

  • 学习hadoop第一周
    刚开始接触Hadoop,我深感这一大数据处理框架的复杂与强大。Hadoop以其分布式存储和处理海量数据的能力,在业界享有盛誉,成为大数据领域的核心技术之一。在学习过程中,我首先遇到了Hadoop的架构理解难题。Hadoop采用主从架构,包括HDFS、YARN等核心组件,每个组件都有其独特的功能和相互之......
  • 学习Hadoop2
    1.理解Hadoop的基本概念在开始学习之前,首先要理解Hadoop的核心概念。Hadoop主要由两个部分组成:HDFS(HadoopDistributedFileSystem)和MapReduce。HDFS是一个分布式文件系统,它将大型数据集分散存储在多个机器上。MapReduce是一种编程模型,用于在大规模数据集上进行并行处理。2.......
  • 学习java进度报告
    helloJava假期`已经过去一周了,也已经完全的放纵一周了,也该拾起学习大业了.看到了暑假生活指导,还是很有压力的,以前只觉得java和之前学的编程语言差不多.现在才知道程度区别很大,以前最多写写简单的编程题目,这次要掌握JAVAweb的前后台开发技术,甚至编写javaweb信息管理系......
  • 优质WPF免费学习资源分享(含代码)
    WPF自学资源分享背景自身是winform开发,winform岗位比较少。wpf和winfom殊途同归,所以自身最近也在学习wpf。分享一下自己寻找到的wpf学习资源,希望对大家有帮助。学习资源推荐书籍学习资源《深入简出WPF》-刘铁猛作者是微软的高级开发工程师,多年的wpf开发经验。不过作者......
  • 深度学习调参
    此文整理总结github上的一个资料,结尾附上链接。对于工程应用很有现实参考,带入实际工作场景中会有不少的收获。这份文档旨在帮助工程师和研究人员系统性地优化深度学习模型的性能。它涵盖了从项目启动到模型部署的各个环节,包括:模型选择:建议从成熟的模型架构开始,并根据需......
  • JavaScript的基础学习(一)
    从头开始学习JavaScript,重新开始打基础<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>......
  • 一起学习LeetCode热题100道(11/100)
    11.滑动窗口最大值(学习)给你一个整数数组nums,有一个大小为k的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的k个数字。滑动窗口每次只向右移动一位。返回滑动窗口中的最大值。示例1:输入:nums=[1,3,-1,-3,5,3,6,7],k=3输出:[3,3,5,......
  • 第二周学习报告
    又经过了一周的学习,今天对本周学习进行总结本周安装了IDEA,了解并学习了相关知识。还学习了Java中键盘录入、运算符、判断和循环的用法。IDEAIDEA全称IntelliJIDEA,是java编程语言的集成开发环境,它广泛应用于软件开发领域。IDEA官网:https://www.jetbrains.com/idea/键盘录入J......
  • 模型部署 - TensorRT & Triton 学习
    先介绍TensorRT、Triton的关系和区别:TensorRT:为inference(推理)为生,是NVIDIA研发的一款针对深度学习模型在GPU上的计算,显著提高GPU上的模型推理性能。即一种专门针对高性能推理的模型框架,也可以解析其他框架的模型如tensorflow、torch。主要优化手段如下: Triton:类似于TensorFlo......
  • 深度学习 - 门禁系统的人脸录入和识别流程
    门禁系统中的人脸录入和识别通常采用以下几种算法和技术:1.人脸检测(FaceDetection)人脸检测是人脸识别系统的第一步,用于在图像或视频中定位和提取人脸区域。常用的算法包括:HaarCascades (OpenCV):经典的基于特征的检测方法。HOG(HistogramofOrientedGradients) + S......