首页 > 其他分享 >dolphinscheduler 调度spark on k8s

dolphinscheduler 调度spark on k8s

时间:2023-07-30 10:35:01浏览次数:41  
标签:dolphinscheduler -- 配置 模式 spark k8s

dolphinscheduler 对于k8s的支持可以使用spark任务模式选择k8s 配置,当然也可以直接通过k8s 集成通过容器镜像模式运行,两种方式各有利弊,但是完全基于k8s模式会比较方便些

集成玩法说明

  • spark 任务模式

此模式我们需要配置SPARK_HOME 给每个dolphinscheduler worker 节点,同时对于多版本的支持也是可以的,我们通过对于不同worker节点配置不同的版本就可以了,如果是使用非容器模式还是很方便的,但是如果dolphinscheduler给予了容器部署,就需要制作不少镜像

  • 通过k8s任务模式 
    此模式只需要配置k8s 任务,同时制定spark镜像,对于运行通过制定运行命令(spark_submit)以及配置参数,使用上还是比较简单的,但是注意参数配置

配置实例

  • spark 任务模式

因为我worker 使用了docker 没有配置,主要演示下

 

  • k8s 任务模式

因为执行命令以及参数需要时数组,不然就会有问题,注意
命令参考["/opt/spark/bin/spark-submit"]
参数配置参考["--master","k8s://https://xxxxxx:6443","--deploy-mode", "cluster","--name", "spark-pi","--class", "org.apache.spark.examples.SparkPi","--conf","spark.executor.instances=1","--conf","spark.kubernetes.authenticate.driver.serviceAccountName=spark","--conf","spark.kubernetes.container.image=apache/spark:3.4.1","local:///opt/spark/examples/jars/spark-examples_2.12-3.4.1.jar"]

 

参考效果图

  • 基于worker 节点的spark 配置

 

  • 通过集成k8s任务模式

 

说明

实际上目前dolphinscheduler版本的功能已经很强大,全面了,支持了不少数据源,以及调度模式,但是目前官方文档感觉写的不是很好,没有跟进,对于实际使用还是得多思考尝试

参考资料

https://dolphinscheduler.apache.org/zh-cn/docs/3.1.7/guide/task/spark
https://dolphinscheduler.apache.org/zh-cn/docs/3.1.7/guide/task/kubernetes

标签:dolphinscheduler,--,配置,模式,spark,k8s
From: https://www.cnblogs.com/rongfengliang/p/17591088.html

相关文章

  • centos7 k8s 三节点 全二进制部署 1.23.15
    主机名IP地址Pod网段Service网段master192.168.1.60172.16.0.0/1210.96.0.0/16node01192.168.1.70172.16.0.0/1210.96.0.0/16node02192.168.1.80172.16.0.0/1210.96.0.0/16[root@master~]#cat/etc/redhat-releaseCentOSLinuxrelease7.9.2......
  • PysparkNote006---pycharm加载spark环境
    pycharm配置pyspark环境,本地执行pyspark代码spark安装、添加环境变量不提了File-Settings-Project-ProjectStructure-addcontentroot添加如下两个路径D:\code\spark\python\lib\py4j-0.10.7-src.zipD:\code\spark\python\lib\pyspark.zip                ......
  • [k8s]k8s入门笔记
    ......
  • 安装spark local运行出现错误NoClassDefFoundError: org/slf4j/Logger 原来是要设置
    Error:Unabletoinitializemainclassorg.apache.spark.deploy.SparkSubmitCausedby:java.lang.NoClassDefFoundError:org/slf4j/Logger HowtoinstallsparklocallyConsideringsparkwithouthadoopbuilt-in.Downloadhadoopunpackto/opt/hadoop/Downloadsp......
  • k8s部署单机版nacos
    来源:https://www.jianshu.com/p/4f69d1b369d1mysql安装mysql如下:创建mysql.yml文件如下:[root@DoM01nacos]#catmysql.yamlapiVersion:v1kind:ReplicationControllermetadata:name:mysqlnamespace:nacoslabels:name:mysqlspec:replicas:1......
  • MicroK8s 引起的 kubadm init 失败,端口占用
    前言今天在ubuntu20上安装k8s集群,前面的步骤都完成了,结果在kubeadminit的时候出现了下面的问题。errorexecutionphasepreflight:[preflight]Somefatalerrorsoccurred:[ERRORPort-10259]:Port10259isinuse[ERRORPort-10257]:Port10257isi......
  • 最后的组合:K8s 1.24 基于 Hekiti 实现 GlusterFS 动态存储管理实践
    前言知识点定级:入门级GlusterFS和Heketi简介GlusterFS安装部署Heketi安装部署Kubernetes命令行对接GlusterFS实战服务器配置(架构1:1复刻小规模生产环境,配置略有不同)主机名IPCPU内存系统盘数据盘用途ks-master-0192.168.9.912450100KubeS......
  • k8s 按照文档
    一、环境准备两台服务器:1、master2、worker-node3、关闭防火墙:systemctlstopfirewalldsystemctldisablefirewalld4、关闭selinuxsed-i's/enforcing/disabled/'/etc/selinux/configsetenforce05、关闭swapswapoff-ased-ri's/.*swap.*/#&/'/etc/fstab6、服务器规划cat......
  • 创建k8s 镜像仓库登录密钥
    原标题:k8s使用私有镜像仓库的访问凭据配置k8s创建私有仓库凭据有两种方式1.使用kubectl命令创建secret2.使用docker凭证作为k8s的凭据。文章来源地址https://www.yii666.com/blog/458024.html1.使用kubectl命令创建secretkubectlcreatesecretdocker-registry<name>--do......
  • k8s数据卷 Volume 之 hostPath 与 emptyDir
    一、为什么需要volume(数据卷)?容器中的文件在磁盘上是临时存放的,这给容器中运行比较重要的应用程序带来一些问题。问题1:当容器升级或者崩溃时,kubelet会重建容器,容器内文件会丢失问题2:一个Pod中运行多个容器需要共享文件。Kubernetes卷(Volume)这一抽象概念能够解决这两个问题......