首页 > 其他分享 >第二周

第二周

时间:2023-07-22 21:57:08浏览次数:26  
标签:HDFS python Hadoop 第二周 DataNode NameNode block

这周了解了hadoop技术框架。Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。

HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。采用Java语言开发,可以部署在多种普通的廉价机器上,以集群处理数量积达到大型主机处理性能。HDFS采用master/slave架构。一个HDFS集群包含一个单独的NameNode和多个DataNode。NameNode作为master服务,它负责管理文件系统的命名空间和客户端对文件的访问。NameNode会保存文件系统的具体信息,包括文件信息、文件被分割成具体block块的信息、以及每一个block块归属的DataNode的信息。对于整个集群来说,HDFS通过NameNode对用户提供了一个单一的命名空间。 DataNode作为slave服务,在集群中可以存在多个。通常每一个DataNode都对应于一个物理节点(当然也不排除每个物理节点可以有多个DataNode,不过生产环境里不建议这么做)。DataNode负责管理节点上它们拥有的存储,它将存储划分为多个block块,管理block块信息,同时周期性的将其所有的block块信息发送给NameNode。

这周还学习了一点python的知识,学习了python中的变量类型,python中的运算符,python中的条件语句、循环语句、while循环语句、for循环语句、python循环嵌套等等知识点。

 

标签:HDFS,python,Hadoop,第二周,DataNode,NameNode,block
From: https://www.cnblogs.com/mine-my/p/17574335.html

相关文章

  • 假期第二周总结
    本周花在学习上的时间大约有四五天的时间,每天将近半天,先从安装Spark开始在厦门大学数据实验室学习的,在安装Spark之前要先安装Hadoop(伪分布式)在安装配置Hadoop之前又重新安装配置了VMware和虚拟机,虽然之前安装过但为了避免之后出现一些问题,又按照教程重新安装了一边,虚拟机用的......
  • 每周总结 第二周
    学习了idea的使用技巧,复习并检验了JDBC基础代码。本周编程学习时间约11h,其中代码时间约占3h,主要用于验证idea使用技巧和数据库连接与JDBC中的CRUD等基础操作,理论学习约占8h,主要学习python语言基础和复习JAVA语言、C++语言基本语法。......
  • 2023-07-16~07-22第二周暑假生活
    本周平均学习时间为3小时每天,大部分时间在学习CSScss通过伪类伪元素动画效果可以实现许多有趣的动画;动画元素为animotion;在css中一般这样定义:animation:nameattribute1attribute2...;/*attribute可以省略*/@keyframesname{/*具体实现*/0%{/*动画时间进行到0%的效果*/}10......
  • 第二周总结
    这周,在自学大数据领域的过程中,我取得了不少进展。我专注于学习大数据的核心概念、技术和工具,并且通过实践项目来巩固所学的知识。以下是我本周学习和实践的总结:首先,我深入研究了大数据的相关概念和技术栈。我了解了大数据的定义、特征和挑战,学习了Hadoop和Spark这两个主要的大数据......
  • 暑假第二周
    这一周配置了虚拟机,安装了linux系统,并学习了一些Linux的命令1..Linux的目录结构是一个树型结构windows系统可以拥有多个盘符如C盘、D盘、E盘Linux没有盘符这个概念,只有一个根目录/所有文件都在它下面2.Linux路径的描述方式在Linux系统中,路径之间的层级关系,使用:/来表示在wi......
  • 第二周训练总结
    第二周训练总结比赛第四场个人赛AC:A:水题,签到题B:枚举,枚举每两个字符串,如果这两个串没有同一位都是$x$,答案就加一C:模拟,用一个$flag$记录遍历到的引号是否为奇数下标,然后用.去替换,即可I:分类讨论,分别判断字符串长度、首位字符、第二个字符以及其余字符即可J:模拟,首先预处......
  • 假期第二周
    这周还是老样子,从7月10号打工到现在,攒了一笔不小的金额了,为了下学期能够吃的更好,玩的更爽。24号开始练车,这段时间只能晚上抽出2小时学习大数据,其他都在上班,真的好累啊,不过坚持就是胜利!打完工我想去我的南方朋友家玩,正好这笔钱可以作为旅游的资本,真不戳啊哈哈哈!......
  • 省选计划(第二周)
    知识回顾:巩固:二分,倍增,优化DP,莫队,分数规划,网络流,二分图,贪心,set/map,KMP深入研究:分治(线段树分治),后缀数组,费用流简单了解/没学明白:线性基,边分治,数位DP,博弈论练题:[SCOI2015]国旗计划直接模拟复杂度\(O(n^2)\),显然会超时,于是考虑倍增。定义\(st_{i,j}\)表示从i这条......
  • 7.15第二周总结
    一个星期的忙碌,差不多完成第一阶段的任务,主要是要帮家里干活比较多,休息学习时间少之又少。那么从下周一开始,正式进入自学阶段,定个小目标,若没有特别安排,下周之前学习20小时,包括布置得作业,以及自我的复习总结,这些都是需要完成的。大方向确立以后,接下来的筹备工作是重中之重,选好方向......
  • 暑假第二周总结
      本周学习到的内容有HDFS集群启停命令,如何使用命令操作HDFS文件系统,并在DataGrip中安装了图形化BigDataTools插件用于对HDFS中文件的操作,HDFS的存储原理及数据的读写流程;还学习了分布式计算,MapReduce用来做分布式计算,还有yarn,用来做资源的分配管理。YARN容器是从角色分配资源......