首页 > 其他分享 >3.2.0 终极预告!云原生支持新增 Spark on k8S 支持

3.2.0 终极预告!云原生支持新增 Spark on k8S 支持

时间:2023-08-28 19:11:05浏览次数:34  
标签:K8S DolphinScheduler 3.2 Apache Spark k8S 日志

file

视频贡献者 | 王维饶

视频制作者 | 聂同学

编辑整理 | Debra Chen

Apache DolphinScheduler 3.2.0 版本将发布,为了让大家提前了解到此版本更新的主要内容,我们已经制作了几期视频和内容做了大致介绍,包括《重磅预告!Apache DolphinScheduler 3.2.0 新功能“剧透”》《3.2.0 版本预告!Apache DolphinScheduler API 增强相关功能》《3.2.0 版本预告!远程日志解决 Worker 故障获取不到日志的问题》。

今天,我们来介绍另一个用户也很关注的云原生相关功能更新。

https://www.bilibili.com/video/BV1e8411Q789/?vd_source=e59b2227d15c7740a5c5f40e4a675095

今天为各位介绍一下 Apache DolphinScheduler 3.2.0云原生的相关新功能,主要分为两个部分:

  • 对K8S任务类型的增强
  • 对Spark on K8S新功能的支持

K8S任务类型增强

我们主要是介绍三个新功能:

  • 支持自定义标签
  • 支持自定义节点选择器
  • 支持任务日志的实时收集

对于前两个功能,因为K8S本身提供了对各类对象去定义Label的能力,使得用户也可以更好地进行对象的管理。

另外,用户也可以去定义节点选择器,将对象调度到指定节点上。这两个功能在生产环境中对用户是有很大的帮助的。因此,3.2.0版本也选择去实现支持这两个功能。

日志实时收集其实是对3.1.X版本的改进。之前,Apache DolphinScheduler只会在任K8S任务执行失败的时候去收集末尾起几行错误日志,但显然实时收集全量日志是对用户更加友好的一个功能。

我们跑一个K8S类型的任务,来看一下这三点增强的效果(见视频 01:11s-03:06s)。

Spark on K8S支持

在3.2.0版本中,Apache DolphinScheduler将支持Spark提交到原生K8S集群的模式。

以事先定义好的一个Spark on K8S的工作流为例,在这个Spark任务中,我们会发现已经添加了一个新的选择框—Namespace。如果用户选择了Namespace,即它非空时,我们认为用户是期待把这个Spark任务提交到K8S集群上做执行。

同样地,在这个任务中,用户也可以去自定义他们的Option,具体可以参考Spark官网,根据自己K8S集群的状态去定义他们的Option。

在Spark on K8S的任务中,我们也会实时地收集Driverpod日志,并对Driverpod进行生命周期管理。如果当前任务是执行成功的状态,我们会将Pod删除掉;如果执行失败,Pod会保留在集群中,供用户做诊断分析。

查看运行状态(见视频04:03s-结尾)。

本文由 白鲸开源 提供发布支持!

标签:K8S,DolphinScheduler,3.2,Apache,Spark,k8S,日志
From: https://www.cnblogs.com/DolphinScheduler/p/17663193.html

相关文章

  • 彻底卸载k8s(重置k8s)
    注意:master和slave节点都需要执行相同操作。1、停止相关服务systemctlstopkubeletsystemctlstopetcdsystemctlstopdocker2、卸载k8skubeadmreset-f3、删除k8s相关目录modprobe-ripiplsmodrm-rf~/.kube/rm-rf/etc/kubernetes/rm-rf/etc/systemd/s......
  • docker和k8s
    dockerDocker是一种开源的容器化平台,它的主要目标是简化应用程序的部署和管理。通过使用Docker,开发人员可以将应用程序及其依赖项打包到一个称为容器的独立单元中,以便在不同的环境中进行部署和运行。Docker的主要用途包括:应用程序的隔离性:Docker容器提供了一种轻量级的虚拟......
  • k8s搭建遇到的问题
    1.端口不能使用例如66662.docker没有restart导致网络没生效3.calico因为网卡导致routeip出错  pod直接访问内部17.XXX网卡的ip,而且ip不断变化和新增的pod不好管理->使用service例如label来管理相同的pod,可以使用customIP类型但是外部访问不了->使用service的nodePo......
  • k8s里面pv pvc
    [root@k8-masterhome]#cat/home/npm-pv.yamlapiVersion:v1kind:PersistentVolumemetadata:name:npm-repository-pvspec:capacity:storage:50GiaccessModes:-ReadWriteManystorageClassName:"npm-repository-pv"nfs:server:192.168.1......
  • Prometheus on k8s 部署与实战操作进阶篇
    目录一、概述二、常见的几款监控工具1)kube-prometheus和kube-prometheus-stack区别2)PrometheusOperator和kube-prometheus或kube-prometheus-stack对比三、PrometheusOperator架构四、快速在k8s内搭建Prometheus全家桶1)k8s环境安装2)安装helm3)【第一种安装方法】直接......
  • 乌班图20.04版本下idea打开项目报错闪退(记录)ideaIU-2023.2.1.tar.gz
    [553960]WARN-#c.i.i.c.t.p.v.p.StateDatabaseParser-Nosuitabledriverfoundforjdbc:sqlite:/root/.config/Code/User/globalStorage/state.vscdbjava.sql.SQLException:Nosuitabledriverfoundforjdbc:sqlite:/root/.config/Code/User/globalStorage/stat......
  • kubeadm 安装k8s1.28.x 底层走containerd 容器
    一:k8s1.28.x的概述1.1:k8s1.28.x更新Kubernetesv1.28是2023年的第二个大版本更新,包含了46项主要的更新。而今年发布的第一个版本v1.27有近60项,所以可以看出来,在发布节奏调整后,每个Kubernetes版本中都会包含很多新的变化。其中20个增强功能正在进入Alpha......
  • 基于spark招生系统的设计与实现-计算机毕业设计源码+LW文档
    基于spark招生系统的设计与实现-计算机毕业设计源码+LW文档摘要随着高校的发展,教育改革的深入推进,高考学生数量越来越多。高考志愿管理逐渐成为高校管理必不可少的组成部分。高考志愿包括高校信息、专业信息、招生信息等,管理员和教务部门需要耗费大量的精力来管理高考志愿信息,严重......
  • pyspark学习
    上周学习了hadoop和hive相关知识,最主要的就是通过hsql实现数据的清洗,从数仓中获得有用的数据,然后本周学习了spark以及用Python类库pyspark。首先是需要在Windows本地和Linux上班均安装anaconda环境,在anaconda安装完成之后就是将spark的安装包上传解压到Linux指定目录下,完成这两步......
  • 玩转K8s + Istio
    K8S与Istio分工Istio介绍术语服务网格(ServiceMesh)用来描述组成应用程序的微服务网络以及它们之间的交互,它的核心思想就是Sidecar模式。Sidecar模式是一种将应用功能从应用本身剥离出来作为单独进程的设计模式,该模式允许我们向应用无侵入添加多种功能。通信的事情全部交给......