首页 > 其他分享 >暑假总结3

暑假总结3

时间:2023-07-30 10:35:14浏览次数:33  
标签:总结 HDFS 文件 Hadoop Datanode 暑假 Namenode block

Hadoop分布式文件系统(Hadoop Distributed File System,简称HDFS)是Hadoop的核心模块之一,它主要解决Hadoop的大数据存储问题,其思想来源与Google的文件系统GFS。HDFS的主要特点:

  • 保存多个副本,且提供容错机制,副本丢失或宕机自动恢复。默认存3份。
  • 运行在廉价的机器上。
  • 适合大数据的处理。HDFS默认会将文件分割成block,64M为1个block。然后将block按键值对存储在HDFS上,并将键值对的映射存到内存中。如果小文件太多,那内存的负担会很重。

  HDFS中的两个重要角色:

  [Namenode]

  1)管理文件系统的命名空间。

  2)记录 每个文件数据快在各个Datanode上的位置和副本信息。

  3)协调客户端对文件的访问。

  4)记录命名空间内的改动或者空间本省属性的改动。

  5)Namenode 使用事务日志记录HDFS元数据的变化。使用映像文件存储文件系统的命名空间,包括文件映射,文件属性等。

  从社会学来看,Namenode是HDFS里面的管理者,发挥者管理、协调、操控的作用。

  [Datanode]

  1)负责所在物理节点的存储管理。

  2)一次写入,多次读取(不修改)。

  3)文件由数据库组成,一般情况下,数据块的大小为64MB。

  4)数据尽量散步到各个节点。

  从社会学的角度来看,Datanode是HDFS的工作者,发挥按着Namenode的命令干活,并且把干活的进展和问题反馈到Namenode的作用。

标签:总结,HDFS,文件,Hadoop,Datanode,暑假,Namenode,block
From: https://www.cnblogs.com/wangzelin/p/17591086.html

相关文章

  • 第三周总结
    本周在学习Python与大数据相关的内容中,我经历了一段充实而有收获的时间。以下是我本周的总结。首先,我开始了深入学习Python编程语言,这是一种简洁且功能强大的语言,广泛应用于数据处理和大数据分析。我复习了Python的基础知识,包括数据类型、变量、条件语句和循环结构等。此外,我还进......
  • 第四周总结
         这周没怎么学,考驾照来着。。。。     这几周学习下来主要就是了解了以下几点:Hadoop基础知识:Hadoop的概念、体系结构和组件,包括Hadoop分布式文件系统(HDFS)和MapReduce计算模型。理解Hadoop的核心思想和设计原理是建立后续学习的基础。Hadoop生态系......
  • dp题型总结
    dp专项训练与题型总结(持续更新)目录dp专项训练与题型总结(持续更新)常见题型:(常规模型)刷题1:雷涛的小猫(我称此类题型为EZ模型)我的错在于:总结题型:刷题2:教主的花园(我称此类题型为影响模型)我的错在于:经验(变式)变式1:(NOIP模拟赛T1)变式2:(cfArrayPainting)总结题型:(影响模型)常见题型:(......
  • 2023-07-23~07-29第三周暑假生活
    这周学习上有点懈怠周一周二沉迷小说的虚拟世界,周三周四一天只学了2个小时,周四周五在外县考科目二,还没考过......
  • 7.29总结
    上午醒来选通识课,一开始打算只选一次网课的,下学期再选就够7分,后来发现可以一次性选完,那就一次性选完吧,反正怎么也得选,陆陆续续下了一天雨,也不愿学习,刷了几道题,做了几道报告,今晚有算法协会的组织的课,稍微了解了下,进去看了会。......
  • 暑假集训D6 2023.7.29 补题
    原比赛链接2022年华中科技大学程序设计新生赛(重现赛)官方题解华中科技大学2022新生赛(HUSTFCPC2022)题解&滚榜\(underset\)\(\underset{\sim}Λ\)\(\underset{\sim}{abcd}\)N.WalkAlone'sConjecture题意:给定一个整数\(n\),找出两个数\(x\)和\(y\),使得满足如下......
  • 本周总结
    过去一周做的事情开启了大数据的学习开端吧,进一步理解了大数据的相关概念;也对SpringBoot的语法概念进行了深度的理解和实践;同时,互联网+比赛的结果也得到了公布,结果不是很理想,果然A1类还得是A1类;遇到的困难大数据初学磨难听挺多的也,FinalShell的下载,浏览器不支持谁懂啊!Spring......
  • 2023暑假杭电多校做题记录
    杭电0101原本以为单组询问要O(log)做,想了很久不会。发现数据范围是3000,于是直接暴力枚举相遇的点,excrt解两个同余方程即可,通过预处理可以做到\(O(nm+mlog)\)然后确实有加强版的题目CF500G大概可以转化成区间余数最小的问题,但是没研究明白,sad杭电0208线段树维护矩阵板题,比......
  • 暑假周记(7.29)
    BigInteger适合保存比较大的整形BigDecimal适合保存精度更高的浮点型(小数)//1.在对BigInteger进行加减乘除的时候,需要使用对应的方法,不能直接进行+-*///2.可以创建一个要操作的BigInteger然后进行相应操作BigIntegeradd=bigInteger.add(bigInteger2);System.out.......
  • 暑假周记(7.28)
    System类exit退出当前程序System.exit(0);arraycopy:复制数组元素,比较适合底层调用,一般使用Arrays.copyOf完成复制数组int[]src={1,2,3};int[]dest=newint[3];System.arraycopy(src,0,dest,0,3);currentTimeMillens:返回当前时间距离1970-1-1的毫秒数gc:运行垃圾回......