首页 > 其他分享 >分布式定时任务

分布式定时任务

时间:2023-02-24 11:11:59浏览次数:37  
标签:触发 调度 任务 定时 执行 分布式

windows和Linux的cron可实现单机定时任务(平台依赖,单机)
java的Timer、ScheduledExecutorService 和 go的Ticker可在编程语言层面实现定时器(跨平台,单机)

Quartz 是一个完全由 Java 编写的开源作业调度框架(单机控制、没有负载均衡)

 

分布式定时任务(平台化管理、分布式部署、支持海量数据)

定时任务:系统为了自动完成特定任务,实时、延时、周期性完成任务调度的过程
分布式定时任务:把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部署的一种定时任务的管理方式

按触发时机分类:

  • 定时任务
  • 延时任务
  • 周期任务

特点:

  • 自动化
  • 平台化
  • 分布式
  • 伸缩性
  • 高可用

执行方式:

  • 单机任务:随机触发一台及其执行
  • 广播任务:广播到所有机器执行同一个任务
  • Map任务:一个任务分出多个子任务,每个子任务负责一部分计算
  • MapReduce任务:在Map任务基础上对所有子任务结果汇总

定时任务框架:

分布式定时任务 & 大数据处理引擎

  • 关系
    • 都处理海量数据
    • 性能、伸缩性、稳定性高
  • 差异
    • 定时并不是大数据处理引擎要解决的问题
    • 大数据处理引擎致力于讲数据处理成结果,分布式定时任务除了这个还可调用HTTP和RPC服务

实现原理

核心架构

使用一个控制台Admin提供任务管理和干预功能,将问题分解为3个步骤:

  1. Trigger 触发器:解析任务生成触发事件
  2. Scheduler 调度器:分配任务,管理任务生命周期
  3. Executor 执行器:获取执行任务单元,执行任务逻辑

数据流:

用户创建触发条件和功能代码,提交后存入数据库。分布式定时任务框架解析数据并进行调度。

控制台

任务元数据

对任务属性的定义:基础信息、调度时机、执行行为、执行方式

任务实例

一次Job运行的实例:Job_id、触发时间、状态&结果、过程信息

触发器

解析任务的触发规则,在规定时间触发任务的调度

约束:

  • 支持大量任务
  • 支持秒级调度
  • 周期性多次执行
  • 保证秒级扫描高性能,避免资源浪费

方案1:定时扫描+延时消息(腾讯、字节)

方案2:时间轮(Quartz)

可将数据结构优化为最小堆

触发器——高可用

为了防止单点故障使用多个trigger节点,在存储和运行上对不同的业务做隔离,部署时通过数据库锁或分布式锁保证任务只被执行一次。

  1. 使用数据库行锁
    数据库的性能瓶颈较低,节点越多性能越差,这也是Quartz的一个局限
  2. 使用分布式锁——redis、zookeeper
    性能较高

调度器

  1. 资源来源
  2. 资源调度
    1. Executor节点选择:随机节点执行、广播执行、分片执行(按用户自定义分片逻辑拆分,分发到集群不同节点并行执行,提升资源利用率。可用于海量日志统计)
    2. 任务分片:
    3. 任务编排:任务存在先后依赖关系,可通过可视化界面生成有向无环图编排
    4. 故障转移:分片任务通过一致性Hash策略分发任务,当某个Executor执行失败将任务转移到其他机器执行
    5. 高可用
  3. 任务执行

应用

  • 电商
    • 订单30分钟未付款自动关闭
    • 定时发广告消息、发优惠券
  • 互动
    • 支付宝集五福
    • 分红包
  • 游戏
    • 活动结束后批量补发用户未领取奖励
    • 定时更新游戏内榜单

其他解决方案

  • 发货超10天自动收货
    • 分布式定时任务的延时任务
    • 消息队列的延时任务或定时任务
  • 春节集卡活动用户个数统计
    • 分布式定时任务的MapReduce任务
    • 大数据离线处理引擎Hive离线统计
    • 大数据实时处理引擎Flink实时累计

 

标签:触发,调度,任务,定时,执行,分布式
From: https://www.cnblogs.com/zhh567/p/17150565.html

相关文章

  • OpenHarmony 分布式相机(下)
    作者:徐金生前面两篇,已经介绍了分布式相机应用开发的整个流程,有兴趣的可以回顾下:OpenHarmony分布式相机(上)OpenHarmony分布式相机(中)这篇我们主要讲讲分布式相机开发过......
  • Python 异步: 等待任务集合(11)
    我们可以通过asyncio.wait()函数等待异步任务完成。可以等待不同的条件,例如所有任务完成、第一个任务完成以及第一个任务因异常而失败。让我们仔细看看。1.什么是asy......
  • 分布式学习笔记--GFS
    首先GFS是一个分布式存储系统。要设计一个分布式存储系统,面临着很多问题,比较有名的CAP,即一致性,可用性,分区容灾性,CAP得出的结论,只能满足其中两个,作为分布式系统,必不可少的就......
  • 简单友好的 Python 任务调度库
    schedule:https://github.com/dbader/schedule该项目人性化的API设计,让开发者仅用几行代码就能轻松实现定时任务。它不依赖任何第三方库,全部代码也就一个文件800多......
  • 分布式ID
    1,单数据库自增ID第一种方案仍然还是基于数据库的自增ID,需要单独使用一个数据库实例,在这个实例中新建一个单独的表:CREATEDATABASE`SEQID`;CREATETABLESEQID.SEQUEN......
  • 118、商城业务---分布式事务---RabbitMQ延时队列定时关单模拟
    1、使用RabbitMq实现延时队列方法12、基于我们的业务我们使用下面这种方式实现延时队列1、导入依赖<dependency><groupId>org.springfram......
  • HBase--分布式列存储NOSQL数据库
        HBase本质上是一个数据模型,可以提供快速随机访问海量结构化数据。利用Hadoop的文件系统(HDFS)提供的容错能力。它是Hadoop的生态系统,使用HBase在HDFS......
  • 【6】分布式部署+性能指标+总结
                                                         ......
  • 117、商城业务---分布式事务---RabbitMQ延时队列
    1、定时任务存在的问题即任务过期时间为30min,任务在第31min过期,但是在第60分钟才被扫描到2、延时队列是先设置一个过期队列,里面消息过期后不会丢弃而是通过交换机放......
  • 115、商城业务---分布式事务---使用Springboot提供的Seata解决分布式事务
    https://seata.io/zh-cn/seata使用SeataAT模式控制分布式事务的步骤:1、每一个想控制分布式事务的服务对应的数据库都需要创建一个UNDO_LOG表CREATETABLE`undo_log`......