Apache DolphinScheduler 任务调度优化：基于工作组分组的优先级队列设计

2025-05-18 21:41:34作者：劳婵绚Shirley

背景与问题分析

在分布式任务调度系统Apache DolphinScheduler中，任务调度是一个核心功能。当前版本采用单线程处理所有待调度任务，所有任务都存放在同一个等待队列中。这种设计存在一个明显的性能瓶颈：当某个工作组的任务调度失败时，该任务会被重新放回队列末尾，可能导致高优先级任务被低优先级任务插队。

举例说明：假设工作组W中存在三个优先级为A>B>C的任务，当工作组W负载过高时：

高优先级任务A调度失败，被放回队列末尾
系统转而调度优先级次高的任务B
此时工作组W负载恢复正常，任务B被成功调度
结果导致低优先级的任务B先于高优先级的任务A执行

这种调度顺序违背了优先级设计原则，影响了系统调度的公平性和效率。

解决方案设计

核心架构改进

新设计方案采用两级队列结构，将任务按工作组进行分组管理：

全局时间优先队列：保留原有的GlobalTaskDispatchWaitingQueue，但简化为仅按任务提交时间排序
工作组优先级队列：新增WorkerGroupQueueMap，为每个工作组维护独立的DelayQueue，队列内任务按优先级和超时时间排序

关键数据结构

// 工作组队列中的任务比较逻辑
public int compareTo(@NotNull Delayed o) {
    // 优先比较任务优先级
    int priorityComparison = Integer.compare(this.priority, ((Task) other).priority);
    if (priorityComparison != 0) {
        return priorityComparison;
    }
    
    // 优先级相同则比较超时时间
    return Long.compare(this.startTime, ((Task) other).startTime);
}

线程模型优化

新架构采用双线程协作模式：

分发线程：从全局队列中按时间顺序获取任务，根据任务所属工作组将其分发到对应的WorkerGroupQueueMap中
调度线程：从各工作组队列中按优先级获取任务执行，失败时回退到原工作组队列

// 简化的调度逻辑伪代码
doDispatch(){
    // 从全局队列获取任务
    ITaskExecutionRunnable task = GlobalTaskDispatchWaitingQueue.poll();
    // 按工作组分类
    WorkerGroupQueueMap.add(task.getWorkerGroupName(), task);

    // 从各工作组队列获取任务
    Map<String, ITaskExecutionRunnable> tasks = WorkerGroupQueueMap.pollAll();
    for(String workerGroup : tasks.keySet()){
        try {
            dispatchTask(tasks.get(workerGroup));
        } catch (Exception e) {
            // 失败回退
            WorkerGroupQueueMap.add(workerGroup, tasks.get(workerGroup));
        }
    }
}

技术优势

优先级保障：确保同一工作组内高优先级任务始终优先调度
隔离性：不同工作组任务互不干扰，避免资源竞争
弹性扩展：新增工作组时自动创建对应队列，删除时自动清理
故障恢复：调度失败的任务仅影响同工作组任务，不会波及其他组

实现细节

工作组队列管理

WorkerGroupQueueMap内部维护一个映射表，动态管理工作组与队列的关系：

class WorkerGroupQueueMap {
    private Map<String, DelayQueue<DelayEntry<ITaskExecutionRunnable>>> queueMap;
    
    // 添加任务到指定工作组队列
    public void add(String groupName, ITaskExecutionRunnable task);
    
    // 从各工作组队列获取首个任务
    public Map<String, ITaskExecutionRunnable> pollAll();
}