首页 > 其他分享 >大数据管理系统--hadoop是如何工作的

大数据管理系统--hadoop是如何工作的

时间:2022-12-31 11:55:39浏览次数:30  
标签:MASTER 管理系统 -- hadoop 集群 分片 服务器 数据 节点

1.分布式文件系统(3种类型的节点构成,一是大量的普通的数据节点构成一个集群,二是MASTER命名服务器,包括要管理文件由多少个数据块,这些数据块存放在哪个节点上,以及文件访问权限,都在这里定义。三是资源管理的zookeeper,包括目录管理,节点状态的监控)

2.存储管理-Nosql数据库。这个层面的节点服务器我们称之为分片服务器,负责数据分片的读取,便于用户进行数据的交互,MASTER节点负责分片,如何进行分片,放到哪一个分片服务器上去。

3.计算引擎层。MASTER负责接收一个任务,然后怎么把这个任务进行划分,然后调度这个任务的执行,而集群里的各个节点,负责计算任务的实施

每一层的系统,都不一定部署在同一个集群,刚才我们看到好像是在同一集群部署,实际上存储的集群和计算的集群是可以分离的。即:数据放在一个集群上,计算可以在另外一组集群上。在逻辑上在道理上都是可以的。但为了性能的考虑,通常这些不同层上系统的部署是在同一集群的。并且任务的计算节点,和任务所需要处理的数据节点,通常安排在同一台服务器上。这样的好处,就是减少数据的移动,减少网络传输的压力。特别是低速磁盘的访问开销,

在同一个集群下,我们对不同的大数据系统还要进行高效的资源管理,也有相应的软件来负责,在appche hadoop中,这个软件是yarn。

 

 

 

 

 

标签:MASTER,管理系统,--,hadoop,集群,分片,服务器,数据,节点
From: https://www.cnblogs.com/zcl789456/p/17016399.html

相关文章

  • 音视频:JavaCV 视频转码(硬件加速)(GPU)
    需要进行简单的音视频编程,如果不是特别数据C/C++,那么JavaCV应该是比较好的选择,下面记录一下使用JavaCV分离AAC视频数据(转封装的方式,不需要转码)的方法。使用硬件加速编码......
  • k8s部署jenkins
    1.部署Jenkins版本:2.375.1创建命名空间:kubectlcreatenamespacekube-ops创建PVC,为Jenkins提供数据持久化:mkdir-p/root/jenkins_install&&cd/root/jenkins......
  • 代码随想录——回溯算法
    组合题目中等classSolution{List<List<Integer>>result=newArrayList<>();LinkedList<Integer>path=newLinkedList<>();publicList<List<Int......
  • 关于mozi初始化中出现的问题
    在mozi的执行中,出现了一个问题:  经过检查,发现是因为重复初始化了:  经过注释掉红线行,发现顺利运行。......
  • 音视频:JavaCV AAC数据内存读写(PipedInputStream管道流)
    需要进行简单的音视频编程,如果不是特别数据C/C++,那么JavaCV应该是比较好的选择,下面记录一下使用JavaCVAAC数据内存读写(PipedInputStream管道流)的方法。使用管道流需要注......
  • 网络代理
    正向代理正向代理模式如上图所示,客户端发送网络请求到代理服务器,代理服务器发送请求到相应服务端,并且服务端返回的数据先经过代理服务器,再由代理服务器发送给客户端。在......
  • 02-DCGAN
    2016年,AlecRadford等发表的论文《深度卷积生成对抗网络》(简称DCGAN,论文网址:https://arxiv.org/abs/1511.06434)中,开创性地将卷积神经网络应用到生成对抗网络的模......
  • C/C++通讯录(哈希表)[2022-12-31]
    C/C++通讯录(哈希表)[2022-12-31]针对同班同学信息设计一个通讯录,学生信息有姓名,学号,电话号码等,以学生姓名为关键字设计散列表散列函数用除留余数法构造,用链地址法处理冲......
  • 痞子衡嵌入式:Farewell, 我的写博故事2022
    --题图:苏州荷塘月色2022年的最后一天,写个年终总结。困扰大家三年之久的新冠疫情终于在12月全面放开了,痞子衡暂时还没有阳,计划坚持到总决赛。对于2023年,痞子衡还是......
  • 01-GAN
    生成对抗网络(GenerativeAdversarialNetworks,简称GAN)是当前人工智能学界最为重要的研究热点之一。其突出的生成能力不仅可用于生成各类图像和自然语言数据,还启发和推......