首页 > 其他分享 >CDH - [01] 概述

CDH - [01] 概述

时间:2024-03-14 17:47:09浏览次数:20  
标签:01 CM CDH Hadoop Cloudera 概述 组件 集群

 

 

一、什么是CDH

  CDH是Cloudera's Distribution Including Apache Hadoop的缩写,即Cloudera公司发布的Hadoop发行版。它是一个为Hadoop构建的企业级数据平台,提供了Hadoop核心组件的预编译、测试和优化的版本,以及管理这些组件的工具和附加功能。Cloudera提供了易于安装、配置和管理的Hadoop解决方案,使得企业能够更轻松地集成和使用Hadoop进行大数据分析和处理。集成了Zookeeper、HDFS、Yarn...等大数据服务。

 

二、CDH和TDH的区别?

共同点:

  1、两者都是基于Apache Hadoop开发的大数据集成平台,集成了大数据各个服务

  2、都有manager节点对集群agent节点的大数据服务进行可视化监控,并可以对集群节点进行可视化扩容缩容操作。

不同点:

  1、Cloudera作为Hadoop领域的领先企业,拥有广泛的社区和强大的技术支持。提供有免费版CDH以供下载安装使用,在某种程度上,能够有利于对市场的推广。毕竟在当下,IT领域的开源是很重要的,有前人开拓,有后人继往开来,才能让IT技术与时俱进。

  2、TDH(Transwarp Data Hub)依赖于其背后的公司进行支持,并且TDH只有短暂的试用期,后续使用需要联系其厂商,购买相关许可证。并且其并没有广泛的社区,客户在遇到问题时,还是需要联系厂商以提供对应的技术支持以及维护。

 

 

三、CM的作用?

 CM是Cloudera Manager的缩写,它是Cloudera提供的用于管理Hadoop集群的工具。

 CM的主要作用包括:

 1、集群部署和配置

  通过CM,用户可以更轻松地部署和配置Hadoop集群,包括添加或删除节点、配置组件参数等。

 2、监控和诊断

  CM提供了强大的监控功能,可以实时查看集群的运行状态、性能指标等。同时,它还提供了诊断工具,帮助用户快速定位和解决问题。

 3、安全和管理

  CM支持多种安全特性,如Kerberos认证、访问控制等,确保集群的安全性。此外,它还提供了集群管理的功能,如资源调度、作业管理等。

 

四、CDH相对开源的Hadoop,有哪些差异?

1、易用性和管理性:CDH提供了预编译、测试和优化的Hadoop组件版本,以及强大的管理工具(如CM),使得用户可以更轻松地安装、配置和管理Hadoop集群。而开源的Hadoop则需要用户自行处理这些繁琐的工作。

2、稳定性和可靠性:Cloudera对Hadoop组件进行了深入的测试和优化,以确保CDH的稳定性和可靠性。这有助于减少用户在生产环境中可能遇到的问题。

3、安全性和合规性:CDH可能包含更多的安全特性和合规性支持,以满足企业级应用的需求。这些特性可能包括Kerberos认证、审计日志、数据加密等。

4、支持和维护:作为商业产品,CDH提供了专业的技术支持和维护服务,可以帮助用户解决在使用过程中遇到的问题。而开源的Hadoop则主要依赖于社区的支持。

 

 

 

— 要养成终生学习的习惯 —

标签:01,CM,CDH,Hadoop,Cloudera,概述,组件,集群
From: https://www.cnblogs.com/houhuilinblogs/p/18073542

相关文章

  • CTF练习日记——[极客大挑战 2019]Havefun 1
    开启靶机后,看到该界面,一只可爱的小猫,题目也没有更多信息,查看源代码试试看我们可以看到这样一段代码,我们试试cat=dog,发现结果自己出来了,得到了flag:flag{4962ffca-1564-415b-b9e0-77699a797784}......
  • html5&css&js代码 018颜色表
    html5&css&js代码018颜色表一、代码二、效果三、解释这段代码展示了一个基本的颜色表,方便参考使用,同时也应用了各种样式应用方式。一、代码<!DOCTYPEhtml><htmllang="zh-cn"><head><title>编程笔记html5&css&js颜色表</title><metacharset="utf......
  • 微服务day01
    微服务加厚风格,像把一个单独的应用程序开发为一套小程序,每个小程序运行在自己的进程中,使用轻量级机制通信,通常是httpApi,这些服务围绕业务能力构件,通过完全自动化独立部署,这些微服务使用不同的语言,以及不同的存储技术,保持最低的集中式管理。集群与分布式集群是个物理形态,分布式......
  • 计算机网络(001-1)
    计算机网络-方老师总时长24:45:00共50个视频,6个模块此文章包含1.1到1.4的内容简介1.1计算机网络的作用三网融合(三网合一)模拟信号就是连续信号数字信号是离散信号1.2互联网概述以前2兆带宽就要98现在几百兆带宽也就几百块1.3......
  • 501. 二叉搜索树中的众数c
    /***Definitionforabinarytreenode.*structTreeNode{*intval;*structTreeNode*left;*structTreeNode*right;*};*//***Note:Thereturnedarraymustbemalloced,assumecallercallsfree().*/intmax,sum,pre;void......
  • OpenCV4.9.0开源计算机视觉库安装概述
    上一篇:OpenCV环境变量参考下一篇:​​​​​​​OpenCV4.9.0配置选项参考引言:OpenCV是一款开源的计算机视觉库,可用于实时的图像处理、图形识别、机器学习等领域。它具有跨平台、高速、易用等特点,并广泛应用于各种领域,如医学、安防、自动驾驶、AR/VR等。本文将简要介绍如何基......
  • [USACO | Python] 201602B2 Circular Barn
    作为当代建筑的粉丝,农民约翰(John)建造了一个完美圆形的新谷仓。在里面,谷仓由n环组成房间,从1…n的顺时针方向编号。房间的有n个(1<=n<=1000)。每一间房间都有三扇门,两扇分别通往临近的房间,一扇通往谷仓的外面。FarmerJohn想要有准确的ri头牛在房间r中(1<=ri<=100),他......
  • Java面试八股文01-基础部分
    Java文件执行流程编译:将.java文件编译为虚拟机可以识别的.class字节码文件解释:虚拟机执行java字节码文件,将其转化为机器可以执行的机器码执行:机器执行机器码面向对象的三大特性封装继承多态深拷贝和浅拷贝浅拷贝代码举例publicclassPersonimplementsCloneable......
  • XM22010-3直流电源设备:开启高效稳定供电
    XM22010-3直流电源设备:稳定输出,高效供电新典范在直流电源领域,稳定、高效的供电设备是确保各类电子设备正常运行的关键。XM22010-3直流电源设备以其出色的稳定性和高效性,成为市场上的佼佼者。XM22010-3直流电源设备采用了先进的电源转换技术和智能控制算法,能够实现稳定、连续......
  • 5_运行时数据区概述
    运行时数据区概述内存是非常重要的系统资源,承载着操作系统和应用程序的实时运行。JVM内存布局规定了Java在运行过程中内存申请、分配、管理的策略,保证了JVM高效稳定的运行。不同的JVM对内存的划分方式和管理机制存在着部分差异。结合JVM虚拟机规范,来讨论下经典的JVM内存布局。J......