EasyScheduler任务调度中基于Worker Group的任务队列优化方案

2025-05-17 16:46:08作者：裴锟轩Denise

dolphinscheduler

Apache DolphinScheduler，现代数据编排平台，低代码构建高性能工作流，提供直观用户界面，简化复杂数据管道任务依赖管理。支持四部署模式：独立、集群、Docker与Kubernetes；多方式创建管理流程；高可靠性和可用性，分布式架构确保横向扩展能力。性能卓越，比同类平台快N倍，日处理千万级任务。云原生设计，兼容多云数据中心工作流。版本控制，状态灵活操作，多租户支持，权限精细管控。快速开始，从单独或容器化环境轻松上手。独特UI展示，一目了然项目概览和实时监控。欢迎加入社区，贡献改进或报告问题，共建强大数据编排生态。

项目地址：https://gitcode.com/gh_mirrors/ea/EasyScheduler

背景与问题分析

在分布式任务调度系统EasyScheduler中，任务分发机制是核心功能之一。当前系统采用单线程处理所有待分发任务，这些任务被统一存放在一个全局等待队列中。这种设计在实际运行中暴露出一个明显的性能问题：

当某个Worker Group下的工作节点负载过高时，高优先级任务可能会因为分发失败而被重新放回队列尾部，而低优先级任务却可能因为负载变化而先被执行。这种场景直接违反了任务优先级的基本原则，影响了系统调度的公平性和效率。

技术方案设计

为了解决上述问题，我们提出了一种基于Worker Group的多队列任务分发机制。该方案的核心思想是将任务按照Worker Group进行分组管理，每个Worker Group拥有自己独立的任务队列。

核心组件设计

WorkerGroupQueueMap
这是一个按Worker Group名称组织的延迟队列映射结构，每个队列中的任务按照以下规则排序：
- 首先比较任务优先级（数值越大优先级越高）
- 当优先级相同时，再比较任务的过期时间（创建时间）

public int compareTo(@NotNull Delayed o) {
    // 优先比较任务优先级
    int priorityComparison = Integer.compare(this.priority, ((Task) other).priority);
    if (priorityComparison != 0) {
        return priorityComparison;
    }
    // 优先级相同则比较创建时间
    return Long.compare(this.startTime, ((Task) other).startTime);
}

全局任务队列重构
原有的GlobalTaskDispatchWaitingQueue简化为仅按时间排序的队列，不再考虑任务优先级因素。

双线程协作机制

新架构采用双线程协作的工作模式：

时间调度线程
负责从全局队列中按时间顺序获取任务，并将其分发到对应的Worker Group队列中。
任务执行线程
非阻塞地处理所有Worker Group队列中的任务，严格按照优先级和时间顺序执行。当任务执行失败时，会将其重新放回原Worker Group队列。

动态Worker Group管理

系统通过以下机制保证Worker Group变更时的数据一致性：

守护线程定期检测Worker Group变更情况
API接口在Worker Group变更时主动通知Master节点
WorkerGroupQueueMap动态创建和销毁对应的任务队列

架构优势

优先级保障
确保高优先级任务总能优先获得执行机会，不受Worker Group负载波动影响。
隔离性
不同Worker Group的任务互不干扰，某个Worker Group的负载问题不会波及其他组。
可扩展性
新增Worker Group无需修改核心调度逻辑，系统自动创建对应的任务队列。
故障恢复
任务执行失败后会被重新放回原队列，保证任务不会丢失。

实现效果

通过这种设计，EasyScheduler能够：

严格保证任务优先级顺序
提高系统整体吞吐量
增强调度公平性
降低高负载场景下的任务等待时间

该方案已在生产环境验证，显著提升了大规模任务调度场景下的系统稳定性和执行效率。

dolphinscheduler

Apache DolphinScheduler，现代数据编排平台，低代码构建高性能工作流，提供直观用户界面，简化复杂数据管道任务依赖管理。支持四部署模式：独立、集群、Docker与Kubernetes；多方式创建管理流程；高可靠性和可用性，分布式架构确保横向扩展能力。性能卓越，比同类平台快N倍，日处理千万级任务。云原生设计，兼容多云数据中心工作流。版本控制，状态灵活操作，多租户支持，权限精细管控。快速开始，从单独或容器化环境轻松上手。独特UI展示，一目了然项目概览和实时监控。欢迎加入社区，贡献改进或报告问题，共建强大数据编排生态。

项目地址：https://gitcode.com/gh_mirrors/ea/EasyScheduler

登录后查看全文

最新内容推荐

Python Django图书借阅管理系统：高效智能的图书馆管理解决方案 LabVIEW串口通信开发全攻略：从入门到精通的完整解决方案操作系统概念第六版PDF资源全面指南：适用场景与使用教程谷歌浏览器跨域插件Allow-Control-Allow-Origin：前端开发调试必备神器 Python开发者的macOS终极指南：VSCode安装配置全攻略深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器 Windows Server 2016 .NET Framework 3.5 SXS文件下载与安装完整指南基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器 SteamVR 1.2.3 Unity插件：兼容Unity 2019及更低版本的VR开发终极解决方案 MQTT客户端软件源代码：物联网开发的强大工具与最佳实践指南

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统