首页 > 其他分享 >Azkaban - [01] 概述

Azkaban - [01] 概述

时间:2024-04-17 16:12:57浏览次数:25  
标签:执行 01 调度 Azkaban 工作 任务 概述 任务调度

简单的任务调度使用crontab、复杂的任务调度使用oozie、azkaban等开发调度系统。

 

一、为什么学习Azkaban

  一个完整的数据分析系统通常都是由大量任务单元(shell脚本、java程序、MapReduce程序、Hive脚本等)组成。各任务单元之间存在先后及前后依赖关系,为了组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行。

 

二、什么是Azkaban

  Azkaban是由LinkedIn公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的 key:value(键值对)的方式,通过配置中的dependencies来设置依赖关系。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。

 

三、Azkaban的特点

  • 兼容各种版本的Hadoop
  • 易于使用的web用户界面
  • 简单的工作流上传
  • 方便设置任务之间的关系
  • 调度工作流
  • 模块化和可插拔的插件机制
  • 认证/授权(权限的工作)
  • 能够杀死并重新启动任务流
  • 有关失败和成功的电子邮件提醒

 

四、Azkaban的架构

Azkaban Web Server
是整个 Azkaban 工作流系统的主要管理者 负责用户登录认证、负责 project 管理、定时执行工作流、跟踪工作流执行进度等一系列任务。
  AzkabanExecutorServer
负责具体的工作流的提交、执行,通过 mysql数据库来协调任务的执行。
  关系型数据库(MySQL)
存储大部分执行流状态,AzkabanWebServer 和 AzkabanExecutorServer 都需要访问数据库。
   

五、Oozie和Azkaban特性对比

特性 Oozie Azkaban
工作流描述语言 XML 键值对
是否要web容器
进度跟踪 网页 网页
Hadoop job调度支持
运行模式 daemon daemon
事件通知 ×
需要安装
支持的Hadoop版本 0.20+
重试支持 workflownode evel
运行任意命令

 

 

 

 

— 要养成终身学习的习惯 —

标签:执行,01,调度,Azkaban,工作,任务,概述,任务调度
From: https://www.cnblogs.com/houhuilinblogs/p/18140999

相关文章

  • MBR40100PT-ASEMI肖特基二极管MBR40100PT
    编辑:llMBR40100PT-ASEMI肖特基二极管MBR40100PT型号:MBR40100PT品牌:ASEMI封装:TO-247最大平均正向电流(IF):40A最大循环峰值反向电压(VRRM):100V最大正向电压(VF):0.88V工作温度:-40°C~170°C反向恢复时间:5ns芯片个数:2芯片尺寸:130mil引脚数量:3正向浪涌电流(IFMS):400A包装方式:50/......
  • 4-01. 升级到 URP 并创建灯光数据结构
    安装URP安装URP创建Settings修改ProjectSettings让素材支持通用渲染管线如果Convert的时候出现报错,继续点击Convert即可注意,如果报错说场景没有加载,需要把场景加载好之后再转换实现全局光照新建Lights然后创建GlobalLight2D白天的灯光效果晚上......
  • cmake调用VS2019的v140(VS2015)的工具链编译通过
    最近的工作基本上在Linux上做。但是,也有一个小工具需要同时支持Windows/Linux,工具依赖于Qt,从官方下载的版本上有qt5.6.3/5.12.12,这两个版本都有MSVC2015。因此搞了一个Win7的虚拟机,VS2015实在太大了,从VS2019的社区版看到可以定制仅安装C++工具链即可。VS2019裁剪最小项C++核......
  • MBR30100PT-ASEMI肖特基二极管MBR30100PT
    编辑:llMBR30100PT-ASEMI肖特基二极管MBR30100PT型号:MBR30100PT品牌:ASEMI封装:TO-247最大平均正向电流(IF):30A最大循环峰值反向电压(VRRM):100V最大正向电压(VF):0.54V~0.92V工作温度:-40°C~170°C反向恢复时间:5ns芯片个数:2芯片尺寸:122mil正向浪涌电流(IFMS):200AMBR30100PT特性:......
  • 前端【小程序】01-入门篇【注册小程序账号】【开发环境搭建】
    小程序的优势: 学习内容: 两部分内容:1、组件、配置、生命周期、事件处理、数据渲染、API、自定义组件、VantUI、分包加载等2、通告管理、用户管理、房屋管理、报修管理、访客管理等各个功能模块一、注册小程序账号微信公众平台1、在微信公众平......
  • [BSidesCF 2019]Kookie
    [BSidesCF2019]Kookie提示我们使用admin账户登录,并且明示了当前存在一个cookie账户其密码为monster登录并抓包,可以观察到设置了一个Cookie,内容为username=cookie的键值对。显然这里Cookie中的键值对的值作为了服务端在用户通过账户密码登录之后再次访问时验证身份的凭证,将其......
  • P2178 [NOI2015] 品酒大会 题解(评分:8.0)(2024.2.23)
    前言"I'mfree."做法与题解区都不同,虽然麻烦,但是毕竟复杂度是对的,而且想法很自然,还是写一写吧!Solution题意:给定长为\(n\)的字符串\(s\)和长为\(n\)的数组\(A\),对于每个\(r\),求满足\(\text{LCP}(\text{Suffix}(x),\text{Suffix}(y))\ger,x<y\)的数对\((x,y)\)数......
  • MyBatis-01-Demo
    数据库DDLCREATEDATABASE`mybatis_demo01`;--mybatis_demo01.`user`definitionCREATETABLE`user`(`id`intNOTNULLAUTO_INCREMENT,`username`varchar(100)DEFAULTNULL,`birthday`datetimeDEFAULTNULL,`sex`char(1)DEFAULTNULL,`address`......
  • 01 多线程
    线程,进程,多线程继承Thread类//创建线程方式一:继承Thread类,重写run()方法,调用start开启线程线程开始不一定立即执行,由CPU调度执行packagecom.mysoft.demo01;//创建线程方式一:继承Thread类,重写run()方法,调用start开启线程//总结:注意,线程开始不一定立即执行,由CPU调度执行pub......
  • P3295 [SCOI2016] 萌萌哒(倍增并查集)
    题意简述有一个长为\(n\)的数字序列\(s\),有\(q\)组限制\(l_1,r_1,l_2,r_2\)形如\(s_{l_1,\cdots,r_1}=s_{l_2\cdots,r_2}\),求满足所有限制的\(s\)的方案数,数字序列不能有前导0。\(n,q\le10^5\),保证\([l_1,r_1]\)和\([l_2,r_2]\)大小相等。分析字符之间的等量......