首页 > 其他分享 >一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台

一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台

时间:2023-10-24 18:06:07浏览次数:33  
标签:原生 Kubernetes KDP 平台 组件 数据

如果你还在使用传统大数据平台

并且觉得它确实有点坑;

如果你听说过云原生大数据平台

但却不知道它为啥这么火?

如果你想使用云原生大数据平台

却无从下手

现在,一张图“大数据平台的三级跳”

带你轻松了解以上信息

废话不多说,上图!

一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台_云原生大数据平台


传统大数据平台,即Hadoop、Spark、Kafka等集群组件,各自为战。

这里的坑就包括:数据开发迭代速度不够快,集群资源利用效率过低,运维复杂难度大,新的数据组件集成非常复杂等等,想必你一定深有体会!

一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台_大数据_02

具体来说传统大数据平台有什么痛点?因为传统大数据平台比如Hadoop、HBase、Hive每一个子系统都有自己的分布式管理机制以及安装流程,无法共享资源池,所以系统在运行的时候安装和运维比较复杂,工作量非常大,迭代效率低。此外,随着业务系统逐渐向云原生体系迁移,很多企业需要同时在业务系统使用的Kubernetes集群之外单独运行一个Hadoop集群,数据需要在各个不同集群中来回拷贝,没法形成统一的体系,资源使用效率非常低。

一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台_大数据_03

云原生大数据平台,即在云平台上搭建一套大数据组件。

为了避免系统中各个组件各自为战,无法形成统一体系的局面,将Hadoop、Spark、Kafka等一套组件构建在统一的数字底座上,进行统一管理,从而达到资源共享,这就是我们常听说的云原生大数据平台的理念。

一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台_大数据_04

如此看来,解决传统大数据平台的痛点,解决方案就是Everything On Kubernetes,核心的变化就是把大数据组件和大数据应用的发布与运维,用Kubernetes来标准化。

这样做最大的好处就是,各组件在统一管理的过程中,可以达到共享资源、共享工具、共同统计各种使用情况,如此一来不仅资源效率得到提高,也给运维人员省了不少事儿。

一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台_大数据_05

当然,大数据平台的云原生化已经是大势所趋,直接在Kubernetes上运行所有大数据工作负载也已经成为可能。问题来了,Data on Kubernetes是不是只要把大数据组件容器化装到K8s上就可以了?答案当然是否定的!

因为想要实现Data on Kubernetes,除了把它们装起来,还要将所有大数据组件分别云原生化,并通过K8s纳管起来。这一过程中仍有非常多的技术难题需求攻克(具体难题及改造过程在《传统大数据平台的云原生化改造》有过详细介绍)。但智领云认为这些难题不需要每个企业自己去做,所以Kubernetes Data Platform(简称KDP)应运而生。

KDP,即在Kubernetes上使用原生的分布式功能搭建及管理大数据平台。

将多套大数据组件构建在K8s之上(每一套大数据组件就是一个大数据平台),同时提供一个整体的管理及运维工具体系,达到同时管理若干套大数据组件的需求。

一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台_云原生_06

KDP,通过对开源大数据组件的扩展和集成,实现了传统大数据平台到K8s大数据平台的平稳迁移。

作为市场上首个可完全在Kubernetes上部署的容器化云原生大数据平台,智领云自主研发的KDP,深度整合云原生架构优势,将大数据组件、数据应用及资源调度混排,纳入Kubernetes管理体系,从而带你真正玩转云原生!


一图秒懂!从传统大数据平台到云原生大数据平台,再到云原生K8s大数据平台_云原生_07

Kubernetes Data Platform产品架构

简单来讲,KDP可以允许客户在Kubernetes上运行它所有的大数据组件,并把它们作为一个整体管理起来。

在Kubernetes上运行大数据平台有四个好处:

第一,统一管理,复用Kubernetes基础架构,复杂度大大降低;

第二,资源混排,高效利用共享资源池,各个组件及整个集群都很容易弹性伸缩;

第三,整个系统能够快速支持新应用的集成,快速迭代;

第四,系统稳定性得到极大提高,运维效率高。

值得一提的是,KDP既可以快速从零开始打造一套企业级云原生大数据底座平台,同时也可以支持渐进式地对现有大数据系统进行云原生改造和迁移,助力企业更高效地进行数字化创新和数字化转型。

标签:原生,Kubernetes,KDP,平台,组件,数据
From: https://blog.51cto.com/u_15471165/8008852

相关文章

  • 中国科学技术大学携手浪潮信息,数据与计算融合平台助力高水平科研创新
    ......
  • 安防监控视频汇聚平台EasyCVR增加AI算法列表接口的实现方法
    安防监控视频汇聚平台EasyCVR基于云边端一体化架构,具有强大的数据接入、处理及分发能力,可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲、智能分析等功能。平台既具备传统安防监控的能力,也支持提供AI算力算法接入的能力。今天我们......
  • SQLServer2008/2005 生成数据字典语句
    SELECT表名=casewhena.colorder=1thend.nameelse''end,表说明=casewhena.colorder=1thenisnull(f.value,'')else''end,字段序号=a.colorder,字段名=a.name,标识=casewhenCO......
  • 安防监控视频汇聚平台EasyCVR增加AI算法列表接口的实现方法
    安防监控视频汇聚平台EasyCVR基于云边端一体化架构,具有强大的数据接入、处理及分发能力,可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲、智能分析等功能。平台既具备传统安防监控的能力,也支持提供AI算力算法接入的能力。今天......
  • 悦数图数据库 x 阿里云计算巢:打造云上超大规模图数据库
    近年来,图数据库的概念被越来越多的企业反复提及。图(Graph)是一种存储实体,及实体之间关系的数据结构,而图数据库(GraphDatabase)则是一个使用图数据进行存储,同时使用图结构进行语义查询的数据库。图数据库能够高效地将关联数据的实体作为顶点(vertex)存储,关系作为边(edge)存储,并允许对这些......
  • 数据结构学习1
    一、复杂度1.1、大O表示法 1.2、时间复杂    1.3、空间复杂度定义的数据占用多少空间就是空间复杂度O(n) O(n^2)二、渐进符号 渐进上界:大于等于平均时间复杂度渐进下界:小于等于平均时间复杂度渐进紧致界:等于平均时间复杂度 ......
  • 通过Docker搭建Debezium同步MySQL的数据变化
    Debezium是红帽开发的一款CDC产品,和阿里的Canel类似,都是同步binlog,不过强大了一点点。为了不再麻烦,下面称之为dbz。达拉崩吧斑得贝迪卜多比鲁翁...dbz的搭建依赖很多中间件:首先要有个MySQL库,dbz来读取数据库binlog(和数据库当前快照);读到后发给kafka,与kafka通信的叫connector;kaf......
  • 智能视频监控平台EasyCVR接口调用注意事项汇总!
    TSINGSEE青犀视频监控汇聚平台EasyCVR可拓展性强、视频能力灵活、部署轻快,可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等,以及支持厂家私有协议与SDK接入,包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安防视频监控的能力,也具备接入AI智能分析的能力,包括对人、车、......
  • 视频汇聚平台SkeyeVSS新增经纬度选取功能的介绍
    视频汇聚平台SkeyeVSS新增经纬度选取功能的介绍基于智能分析网关的SkeyeVSS国标视频融合云平台,具有海量视频接入、汇聚与管理、处理及分发等视频能力,在视频能力上,可实现视频直播、录像、回放、检索、云存储、告警上报、语音对讲、集群、智能分析以及平台级联等。该平台部署轻量简......
  • C++算法:数据流的中位数
    题目中位数是有序整数列表中的中间值。如果列表的大小是偶数,则没有中间值,中位数是两个中间值的平均值。例如arr=[2,3,4]的中位数是3。例如arr=[2,3]的中位数是(2+3)/2=2.5。实现MedianFinder类:MedianFinder()初始化MedianFinder对象。voidaddNum(int......