EasyScheduler任务实例表自动清理方案设计与实现

2025-05-17 18:31:52作者：韦蓉瑛

Apache DolphinScheduler，现代数据编排平台，低代码构建高性能工作流，提供直观用户界面，简化复杂数据管道任务依赖管理。支持四部署模式：独立、集群、Docker与Kubernetes；多方式创建管理流程；高可靠性和可用性，分布式架构确保横向扩展能力。性能卓越，比同类平台快N倍，日处理千万级任务。云原生设计，兼容多云数据中心工作流。版本控制，状态灵活操作，多租户支持，权限精细管控。快速开始，从单独或容器化环境轻松上手。独特UI展示，一目了然项目概览和实时监控。欢迎加入社区，贡献改进或报告问题，共建强大数据编排生态。

项目地址：https://gitcode.com/gh_mirrors/ea/EasyScheduler

背景与需求分析

在长期使用EasyScheduler这类任务调度系统后，数据库中的任务实例表(t_ds_task_instance)会积累大量历史数据，这会导致查询性能下降。特别是对于生产环境中高频调度的任务，数据量增长更为迅速。系统需要一种自动化的清理机制，能够根据业务需求灵活配置保留策略，同时确保清理操作不会影响系统正常运行。

现有解决方案分析

目前社区提出了几种不同的解决方案思路：

直接SQL删除方案：通过编写SQL语句直接操作数据库表进行数据删除。这种方案实现简单，但存在较大风险：
- 可能破坏数据完整性
- 缺乏事务保护
- 可能影响正在运行的工作流
Python脚本方案：通过外部脚本连接元数据库执行清理。这种方案虽然灵活，但：
- 与系统架构不统一（EasyScheduler是Java项目）
- 维护成本高
- 存在与系统API不同步的风险
系统API调用方案：利用系统现有的工作流实例删除API进行清理。这是较为规范的方案，但需要：
- 完善相关查询接口
- 处理批量操作逻辑
- 考虑性能影响

推荐解决方案设计

基于上述分析，我们推荐采用系统级集成的自动清理方案，主要设计要点如下：

核心架构

配置管理：
- 在系统设置中增加"日志清理策略"配置项
- 支持全局开关控制
- 可配置保留时长（如3个月、6个月等）
清理策略：
- 支持黑白名单机制
- 可按项目(project_code)和工作流定义(process_definition_code)过滤
- 支持多种时间维度（创建时间、开始时间、结束时间）
执行机制：
- 内置定时任务调度
- 采用系统现有API进行删除操作
- 支持批量处理与事务控制

技术实现

// 伪代码示例
@Component
public class TaskInstanceCleaner {
    
    @Scheduled(cron = "0 0 1 * * ?") // 每天凌晨1点执行
    public void cleanExpiredInstances() {
        if (!cleanConfig.isEnabled()) {
            return;
        }
        
        Date expireDate = DateUtils.addMonths(new Date(), -cleanConfig.getRetainMonths());
        List<ProcessInstance> instances = processService.queryExpiredInstances(expireDate);
        
        // 应用过滤规则
        instances = filterInstances(instances);
        
        // 批量删除
        batchDeleteInstances(instances);
    }
    
    private List<ProcessInstance> filterInstances(List<ProcessInstance> instances) {
        // 实现黑白名单过滤逻辑
        // 可按project_code和process_definition_code过滤
    }
}