第二周

第二周

时间：2023-07-22 21:57:08浏览次数：32

标签：HDFS python Hadoop 第二周 DataNode NameNode block

这周了解了hadoop技术框架。Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。

HDFS是Hadoop分布式文件系统（Hadoop Distributed File System）的缩写，为分布式计算存储提供了底层支持。采用Java语言开发，可以部署在多种普通的廉价机器上，以集群处理数量积达到大型主机处理性能。HDFS采用master/slave架构。一个HDFS集群包含一个单独的NameNode和多个DataNode。NameNode作为master服务，它负责管理文件系统的命名空间和客户端对文件的访问。NameNode会保存文件系统的具体信息，包括文件信息、文件被分割成具体block块的信息、以及每一个block块归属的DataNode的信息。对于整个集群来说，HDFS通过NameNode对用户提供了一个单一的命名空间。 DataNode作为slave服务，在集群中可以存在多个。通常每一个DataNode都对应于一个物理节点(当然也不排除每个物理节点可以有多个DataNode，不过生产环境里不建议这么做)。DataNode负责管理节点上它们拥有的存储，它将存储划分为多个block块，管理block块信息，同时周期性的将其所有的block块信息发送给NameNode。

这周还学习了一点python的知识，学习了python中的变量类型，python中的运算符，python中的条件语句、循环语句、while循环语句、for循环语句、python循环嵌套等等知识点。

标签：HDFS,python,Hadoop,第二周,DataNode,NameNode,block
From： https://www.cnblogs.com/mine-my/p/17574335.html

假期第二周总结
本周花在学习上的时间大约有四五天的时间，每天将近半天，先从安装Spark开始在厦门大学数据实验室学习的，在安装Spark之前要先安装Hadoop(伪分布式)在安装配置Hadoop之前又重新安装配置了VMware和虚拟机，虽然之前安装过但为了避免之后出现一些问题，又按照教程重新安装了一边，虚拟机用的......
每周总结第二周
学习了idea的使用技巧，复习并检验了JDBC基础代码。本周编程学习时间约11h，其中代码时间约占3h，主要用于验证idea使用技巧和数据库连接与JDBC中的CRUD等基础操作，理论学习约占8h，主要学习python语言基础和复习JAVA语言、C++语言基本语法。......
2023-07-16~07-22第二周暑假生活
本周平均学习时间为3小时每天，大部分时间在学习CSScss通过伪类伪元素动画效果可以实现许多有趣的动画；动画元素为animotion;在css中一般这样定义：animation:nameattribute1attribute2...；/*attribute可以省略*/@keyframesname{/*具体实现*/0%{/*动画时间进行到0%的效果*/}10......
第二周总结
这周，在自学大数据领域的过程中，我取得了不少进展。我专注于学习大数据的核心概念、技术和工具，并且通过实践项目来巩固所学的知识。以下是我本周学习和实践的总结：首先，我深入研究了大数据的相关概念和技术栈。我了解了大数据的定义、特征和挑战，学习了Hadoop和Spark这两个主要的大数据......
暑假第二周
这一周配置了虚拟机，安装了linux系统，并学习了一些Linux的命令1..Linux的目录结构是一个树型结构windows系统可以拥有多个盘符如C盘、D盘、E盘Linux没有盘符这个概念,只有一个根目录/所有文件都在它下面2.Linux路径的描述方式在Linux系统中，路径之间的层级关系，使用:/来表示在wi......
第二周训练总结
第二周训练总结比赛第四场个人赛AC：A：水题，签到题B：枚举，枚举每两个字符串，如果这两个串没有同一位都是$x$，答案就加一C：模拟，用一个$flag$记录遍历到的引号是否为奇数下标，然后用.去替换,即可I：分类讨论，分别判断字符串长度、首位字符、第二个字符以及其余字符即可J：模拟，首先预处......
假期第二周
这周还是老样子，从7月10号打工到现在，攒了一笔不小的金额了，为了下学期能够吃的更好，玩的更爽。24号开始练车，这段时间只能晚上抽出2小时学习大数据，其他都在上班，真的好累啊，不过坚持就是胜利！打完工我想去我的南方朋友家玩，正好这笔钱可以作为旅游的资本，真不戳啊哈哈哈！......
省选计划（第二周）
知识回顾：巩固：二分，倍增，优化DP，莫队，分数规划，网络流，二分图，贪心，set/map，KMP深入研究：分治（线段树分治），后缀数组，费用流简单了解/没学明白：线性基，边分治，数位DP，博弈论练题：[SCOI2015]国旗计划直接模拟复杂度$O(n^2)$，显然会超时，于是考虑倍增。定义$st_{i,j}$表示从i这条......
7.15第二周总结
一个星期的忙碌，差不多完成第一阶段的任务，主要是要帮家里干活比较多，休息学习时间少之又少。那么从下周一开始，正式进入自学阶段，定个小目标，若没有特别安排，下周之前学习20小时，包括布置得作业，以及自我的复习总结，这些都是需要完成的。大方向确立以后，接下来的筹备工作是重中之重，选好方向......
暑假第二周总结
本周学习到的内容有HDFS集群启停命令，如何使用命令操作HDFS文件系统，并在DataGrip中安装了图形化BigDataTools插件用于对HDFS中文件的操作，HDFS的存储原理及数据的读写流程；还学习了分布式计算，MapReduce用来做分布式计算，还有yarn，用来做资源的分配管理。YARN容器是从角色分配资源......

相关文章

赞助商

阅读排行