一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台

时间：2023-10-24 18:06:07浏览次数：35

标签：原生 Kubernetes KDP 平台组件数据

如果你还在使用传统大数据平台

并且觉得它确实有点坑；

如果你听说过云原生大数据平台

但却不知道它为啥这么火？

如果你想使用云原生大数据平台

却无从下手

现在，一张图“大数据平台的三级跳”

带你轻松了解以上信息

废话不多说，上图！

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台_云原生大数据平台

传统大数据平台，即Hadoop、Spark、Kafka等集群组件，各自为战。

这里的坑就包括：数据开发迭代速度不够快，集群资源利用效率过低，运维复杂难度大，新的数据组件集成非常复杂等等，想必你一定深有体会！

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台_大数据_02

具体来说传统大数据平台有什么痛点？因为传统大数据平台比如Hadoop、HBase、Hive每一个子系统都有自己的分布式管理机制以及安装流程，无法共享资源池，所以系统在运行的时候安装和运维比较复杂，工作量非常大，迭代效率低。此外，随着业务系统逐渐向云原生体系迁移，很多企业需要同时在业务系统使用的Kubernetes集群之外单独运行一个Hadoop集群，数据需要在各个不同集群中来回拷贝，没法形成统一的体系，资源使用效率非常低。

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台_大数据_03

云原生大数据平台，即在云平台上搭建一套大数据组件。

为了避免系统中各个组件各自为战，无法形成统一体系的局面，将Hadoop、Spark、Kafka等一套组件构建在统一的数字底座上，进行统一管理，从而达到资源共享，这就是我们常听说的云原生大数据平台的理念。

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台_大数据_04

如此看来，解决传统大数据平台的痛点，解决方案就是Everything On Kubernetes，核心的变化就是把大数据组件和大数据应用的发布与运维，用Kubernetes来标准化。

这样做最大的好处就是，各组件在统一管理的过程中，可以达到共享资源、共享工具、共同统计各种使用情况，如此一来不仅资源效率得到提高，也给运维人员省了不少事儿。

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台_大数据_05

当然，大数据平台的云原生化已经是大势所趋，直接在Kubernetes上运行所有大数据工作负载也已经成为可能。问题来了，Data on Kubernetes是不是只要把大数据组件容器化装到K8s上就可以了？答案当然是否定的！

因为想要实现Data on Kubernetes，除了把它们装起来，还要将所有大数据组件分别云原生化，并通过K8s纳管起来。这一过程中仍有非常多的技术难题需求攻克（具体难题及改造过程在《传统大数据平台的云原生化改造》有过详细介绍）。但智领云认为这些难题不需要每个企业自己去做，所以Kubernetes Data Platform（简称KDP）应运而生。

KDP，即在Kubernetes上使用原生的分布式功能搭建及管理大数据平台。

将多套大数据组件构建在K8s之上（每一套大数据组件就是一个大数据平台），同时提供一个整体的管理及运维工具体系，达到同时管理若干套大数据组件的需求。

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台_云原生_06

KDP，通过对开源大数据组件的扩展和集成，实现了传统大数据平台到K8s大数据平台的平稳迁移。

作为市场上首个可完全在Kubernetes上部署的容器化云原生大数据平台，智领云自主研发的KDP，深度整合云原生架构优势，将大数据组件、数据应用及资源调度混排，纳入Kubernetes管理体系，从而带你真正玩转云原生！

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台_云原生_07

Kubernetes Data Platform产品架构

简单来讲，KDP可以允许客户在Kubernetes上运行它所有的大数据组件，并把它们作为一个整体管理起来。

在Kubernetes上运行大数据平台有四个好处：

第一，统一管理，复用Kubernetes基础架构，复杂度大大降低；

第二，资源混排，高效利用共享资源池，各个组件及整个集群都很容易弹性伸缩；

第三，整个系统能够快速支持新应用的集成，快速迭代；

第四，系统稳定性得到极大提高，运维效率高。

值得一提的是，KDP既可以快速从零开始打造一套企业级云原生大数据底座平台，同时也可以支持渐进式地对现有大数据系统进行云原生改造和迁移，助力企业更高效地进行数字化创新和数字化转型。

标签：原生,Kubernetes,KDP,平台,组件,数据
From： https://blog.51cto.com/u_15471165/8008852

中国科学技术大学携手浪潮信息，数据与计算融合平台助力高水平科研创新
......
安防监控视频汇聚平台EasyCVR增加AI算法列表接口的实现方法
安防监控视频汇聚平台EasyCVR基于云边端一体化架构，具有强大的数据接入、处理及分发能力，可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲、智能分析等功能。平台既具备传统安防监控的能力，也支持提供AI算力算法接入的能力。今天我们......
SQLServer2008/2005 生成数据字典语句
SELECT表名=casewhena.colorder=1thend.nameelse''end,表说明=casewhena.colorder=1thenisnull(f.value,'')else''end,字段序号=a.colorder,字段名=a.name,标识=casewhenCO......
安防监控视频汇聚平台EasyCVR增加AI算法列表接口的实现方法
安防监控视频汇聚平台EasyCVR基于云边端一体化架构，具有强大的数据接入、处理及分发能力，可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲、智能分析等功能。平台既具备传统安防监控的能力，也支持提供AI算力算法接入的能力。今天......
悦数图数据库 x 阿里云计算巢：打造云上超大规模图数据库
近年来，图数据库的概念被越来越多的企业反复提及。图（Graph）是一种存储实体，及实体之间关系的数据结构，而图数据库（GraphDatabase）则是一个使用图数据进行存储，同时使用图结构进行语义查询的数据库。图数据库能够高效地将关联数据的实体作为顶点（vertex）存储，关系作为边（edge）存储，并允许对这些......
数据结构学习1
一、复杂度1.1、大O表示法 1.2、时间复杂 1.3、空间复杂度定义的数据占用多少空间就是空间复杂度O（n） O(n^2)二、渐进符号渐进上界：大于等于平均时间复杂度渐进下界：小于等于平均时间复杂度渐进紧致界：等于平均时间复杂度 ......
通过Docker搭建Debezium同步MySQL的数据变化
Debezium是红帽开发的一款CDC产品，和阿里的Canel类似，都是同步binlog，不过强大了一点点。为了不再麻烦，下面称之为dbz。达拉崩吧斑得贝迪卜多比鲁翁...dbz的搭建依赖很多中间件：首先要有个MySQL库，dbz来读取数据库binlog（和数据库当前快照）；读到后发给kafka，与kafka通信的叫connector；kaf......
智能视频监控平台EasyCVR接口调用注意事项汇总！
TSINGSEE青犀视频监控汇聚平台EasyCVR可拓展性强、视频能力灵活、部署轻快，可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等，以及支持厂家私有协议与SDK接入，包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安防视频监控的能力，也具备接入AI智能分析的能力，包括对人、车、......
视频汇聚平台SkeyeVSS新增经纬度选取功能的介绍
视频汇聚平台SkeyeVSS新增经纬度选取功能的介绍基于智能分析网关的SkeyeVSS国标视频融合云平台，具有海量视频接入、汇聚与管理、处理及分发等视频能力，在视频能力上，可实现视频直播、录像、回放、检索、云存储、告警上报、语音对讲、集群、智能分析以及平台级联等。该平台部署轻量简......
C++算法：数据流的中位数
题目中位数是有序整数列表中的中间值。如果列表的大小是偶数，则没有中间值，中位数是两个中间值的平均值。例如arr=[2,3,4]的中位数是3。例如arr=[2,3]的中位数是(2+3)/2=2.5。实现MedianFinder类:MedianFinder()初始化MedianFinder对象。voidaddNum(int......

一图秒懂！从传统大数据平台到云原生大数据平台，再到云原生K8s大数据平台

传统大数据平台，即Hadoop、Spark、Kafka等集群组件，各自为战。

云原生大数据平台，即在云平台上搭建一套大数据组件。

KDP，即在Kubernetes上使用原生的分布式功能搭建及管理大数据平台。

相关文章

赞助商

阅读排行