7 分布式定时任务调度框架

embedded/2025/1/15 21:41:07/

先简单介绍下分布式定时任务调度框架的使用场景和功能和架构,然后再介绍世面上常见的产品

我们在大型的复杂的系统下,会有大量的跑批,定时任务的功能,如果在独立的子项目中单独去处理这些任务,随着业务的复杂度的提高,大量的任务将很难进行统一的管理,出现bug以后问题也很难排查,最后将成为一种灾难。所以我们引入了分布式定时任务调度框架,统一管理这些定时任务和跑批的功能,出现问题也容易统一管理

1. 分布式定时任务功能

1.1 定时任务的执行、任务管理、执行日志管理
1.2 定时任务架构的高可用。集群、分片、执行失败任务的处理
1.3 一些扩展功能:可视化的运维,多语言支持、任务编排等

2. 调度中心的整体架构
一个分布式定时任务框架主要分为下面三个模块

2.1 调度中心: 负责接收并分配任务,并按照置顶的配置规则执行
2.2 任务执行: 处理实际业务处理并执行,执行完成以后反馈给调度中心
2.3 监控中心: 主要负责节点管理,任务队列管理,监控管理等。

常见的分布式调度框架:xxljob

xxl-job是我极力推荐的框架,在我待过的几家中小型的互联网公司基本上都选用该框架。xxl-job开放源码,简单高效,中小企业用的很多。
1.xxl-job经过持续的迭代,修复了很多bug。2.0开始引入新特性,耦合性降低
2.搭建起来也非常简单,开箱即用。
3.源码开放
4.源码也有很多值得学习的地方,虽然刚发布的时候会有很多资深的程序员诟病,但经过多年的发展维护,已经非常稳定。代码非常朴实,没有那些花里胡哨的花样

xxl-job架构如下图
在这里插入图片描述

调度中心: 用于发布我们需要的执行任务,并且可以控制任务的添加、删除、启动和停止,以及维护日志。并且可以在操作界面进行设置。
执行器: 执行具体业务端,调度中心根据注册的执行器,按照算法分配任务执行。每一个执行器有唯一的appname,与调度中心管理的执行器名称一致,调度中心才分配任务给执行器
任务: 设置执行策略、分片机制、任务、执行器等信息。执行器管理中的appname找到执行器的appname,这样任务就会分配给对应的执行器。

xxl-job的调度原理:
1.调度中心通过http协议请求执行器中的服务,默认的端口是9999
2.执行器执行业务逻辑代码
3.执行器执行完成业务代码后回调调度中心的服务,调度中心开放了一套针对执行器材的API

xxl-job的分片原理
当执行器以集群方式部署的情况下,调度任务的策略选择"分片广播"的情况下,一次调度任务会以广播的形势触发集群中所有的执行器,同时传递分片参数,可以根据分片参数开发分片任务。
xxl-job的架构虽然简单但是用起来是真的爽,没有那一套高大上的架构设计,但是就是好用

常见的分布式调度架构:elastic-job

elastic-job分为两个独立的大块。一个是lite-core(核心去中心化的调度),一个是cloud(监控平台).
在这里插入图片描述

schedule: 会选取一个leader,作为分配执行任务的(包括分片)的机器。
simple: 实现simplejob接口,该接口提供单一的方法覆盖,该方法定时执行并提供了弹性扩容和分片的功能
dataflow: dataflow类型用于处理数据流,需实现DataflowJob接口。该接口提供2个方法可供覆盖,分别用于抓取(fetchData)和处理(processData)数据
script: script类型作业意为脚本类型作业,支持shell,python,perl等所有类型脚本。只需通过控制台或代码配置scriptCommandLine即可,无需编码。执行脚本路径可包含参数,参数传递完毕后,作业框架会自动追加最后一个参数为作业运行时信息。

调度原理
在这里插入图片描述

elastic-job的分布式

通过zookeeper做的分布式锁,先选取leader再做分配工作

常见的分布式调度框架:Schedulerx2.0

分布式任务调度SchedulerX是阿里巴巴自研的基于Akka架构的分布式任务调度平台,兼容开源XXL-JOB、ElasticJob,支持Cron定时、一次性任务、任务编排、分布式执行批量任务等功能,具备高可用、可视化、可运维、低延时等能力。如下图所示;
在这里插入图片描述

常见分布式调度框架:quartz

整体架构图如下:

在这里插入图片描述

常见的分布式调度框架:LTS

使用容器化的技术,定时启动执行器执行任务。

我们使用图表方式对以上几个框架做个总结

在这里插入图片描述

一般情况下中小型的业务的首选就是xxl-job。


http://www.ppmy.cn/embedded/154209.html

相关文章

R语言在森林生态研究中的魔法:结构、功能与稳定性分析——发现数据背后的生态故事!

森林生态系统结构、功能与稳定性分析与可视化研究具有多方面的重要意义,具体如下: 一、理论意义 ●深化生态学理论 通过研究森林生态系统的结构、功能与稳定性,可以深化对生态系统基本理论的理解。例如,生物多样性与生态系统稳定性…

接口测试Day09-数据库工具类封装

封装目的 将 常用的数据库操作,封装到 一个方法。 后续再操作数据库时,通过调用该方法来实现。 提高代码的 复用性! # 封装数据库工具类class DBUtil(object):classmethoddef __get_conn(cls): # 私有方法passclassmethoddef __close_conn(c…

【MATLAB】subplot如何增加title

在 Matlab 中,使用 subplot 函数将图形窗口划分为多个子图,并使用 title 函数为每个子图添加标题。以下是一个示例: matlab % 生成示例数据 x 0:0.1:10; y1 sin(x); y2 cos(x); % 创建一个 2 行 1 列的子图布局,并选…

把PX4及子仓库添加到自己的gitee

导入主仓库 此处以导入PX4为例 先用gitee导入仓库然后clone gitee仓库先checkout到v1.11,git submodule update --init --recursive,确保可以make之后再新建branchgit checkout -b my1.11.0按照提示连接到origin改代码然后三件套就行了git add ./*git …

Gitlab流水线配置

由于格式和图片解析问题,为了更好阅读体验可前往 阅读原文 流水线的流程是,提交代码后,gitlab会检测项目根目录里的.github-ci.yml文件,根据文件中的流水线自动构建,配置文件格式正确性可以在gitlab进行文件校验&#…

排序算法的实现(插入,希尔,选择,冒泡,堆排,快排)

目录 1.选择排序 2.冒泡排序 3.堆排序 4.插入排序 5.希尔排序 6.快排 6.1快排的优化 6.2快排(双指针法) 6.3快排(非递归) 7.归并排序 7.1归并非递归 8.计数排序 1.选择排序 对n个元素进行选择排序,我们可以…

计算机网络 | 什么是公网、私网、NAT?

关注:CodingTechWork 引言 计算机网络是现代信息社会的基石,而网络通信的顺畅性和安全性依赖于有效的IP地址管理和网络转换机制。在网络中,IP地址起到了标识设备和进行数据传输的核心作用。本文将详细讨论公网IP、私网IP以及NAT转换等网络技…

.NET Core NPOI 导出图片到Excel指定单元格并自适应宽度

NPOI:支持xlsx,.xls,版本>2.5.3 XLS:HSSFWorkbook,主要前缀HSS, XLSX:XSSFWorkbook,主要前缀XSS,using NPOI.XSSF.UserModel; 1、导出Excel添加图片效果&#xff0…