Apache DevLake DORA 仪表盘性能优化实践

2025-07-03 03:38:40作者：翟萌耘Ralph

Apache DevLake is an open-source dev data platform to ingest, analyze, and visualize the fragmented data from DevOps tools, extracting insights for engineering excellence, developer experience, and community growth.

项目地址：https://gitcode.com/gh_mirrors/incu/incubator-devlake

Apache DevLake 是一个开源的数据湖平台，用于收集、分析和可视化软件开发过程中的各项指标。其中 DORA（DevOps Research and Assessment）仪表盘是评估团队 DevOps 效能的重要工具，但在实际使用中我们发现其查询性能存在瓶颈。

问题背景

在 DevLake v1.0.1-beta5 版本中，DORA 仪表盘的两个关键面板——"Overall DORA Metrics"和"Change Failure Rate"存在严重的性能问题。原始 SQL 查询执行时间长达 31.7 秒，这对于实时监控来说是不可接受的。

性能瓶颈分析

通过分析原始查询的执行计划，我们发现主要问题在于：

全表连接：查询对 incidents 和 cicd_deployment_commits 表进行了无条件连接
笛卡尔积：由于连接条件为 1=1，导致产生了 5.67 亿条中间结果
缺乏过滤：没有应用项目和时间范围等常见过滤条件

具体来看，incidents 表有 3193 条记录，cicd_deployment_commits 表有 177462 条记录，它们的笛卡尔积导致了巨大的计算量。

优化方案

我们提出了以下优化策略：

避免全表扫描：改为先计算子查询的计数，再进行连接
添加过滤条件：引入项目和时间范围过滤
优化连接方式：使用简单的计数结果连接，而非原始表连接

优化后的查询结构如下：

SELECT
    CASE
      WHEN i.cnt = 0 AND cdc.cnt = 0 THEN 'No All'
      WHEN i.cnt = 0 THEN 'No Incidents'
      WHEN cdc.cnt = 0 THEN 'No Deployments'
    END AS is_collected
FROM
    (SELECT COUNT(*) AS cnt FROM incidents i
     JOIN project_mapping pm ON i.scope_id = pm.row_id AND pm.`table` = i.`table`
     WHERE pm.project_name IN (${project}) AND $__timeFilter(i.created_date)
    ) AS i
    LEFT JOIN (
        SELECT COUNT(*) AS cnt FROM cicd_deployment_commits cdc
        JOIN project_mapping pm ON cdc.cicd_scope_id = pm.row_id AND pm.`table` = 'cicd_scopes'
        WHERE pm.project_name IN (${project}) AND $__timeFilter(cdc.finished_date)
    ) AS cdc ON 1 = 1