Apache DevLake项目中DORA指标数据缺失问题分析

2025-06-30 02:22:17作者：廉皓灿Ida

Apache DevLake is an open-source dev data platform to ingest, analyze, and visualize the fragmented data from DevOps tools, extracting insights for engineering excellence, developer experience, and community growth.

项目地址：https://gitcode.com/gh_mirrors/in/incubator-devlake

Apache DevLake作为一个开源的数据湖平台，在v1.0.0-beta11版本中出现了一个值得注意的问题：PagerDuty数据在DORA看板中缺失，影响了"变更失败率"和"部署恢复时间"两个关键指标的准确性。本文将深入分析这一问题，并提供解决方案。

问题现象

在项目升级到v1.0.0-beta11版本后，部分项目的DORA看板中PagerDuty数据出现缺失。对比v0.21.0稳定版，相同数据库快照下的数据在旧版本中显示正常，而在新版本中却无法展示。

根本原因分析

经过技术排查，发现问题的核心在于webhook创建的部署数据缺失，而PagerDuty的事件数据本身是完整的。这一现象表明：

数据收集机制在版本升级后发生了变化
部署数据的关联逻辑出现了问题
每次运行都会重新计算数据，因此历史数据也会受到影响

技术解决方案

针对这一问题，可以采取以下技术措施：

检查部署数据源配置：
- 验证Jenkins、GitLab CI、GitHub Action等部署源的连接状态
- 确保webhook配置正确且专属于单个项目
数据表验证：
- 检查cicd_deployment_commits表中的部署记录
- 验证project_mapping表的映射关系是否正确

SQL查询验证：

SELECT
    pm.project_name,
    cdc.finished_date,
    cdc.result,
    cdc.environment,
    pd.incident_id
FROM cicd_deployment_commits cdc
LEFT JOIN project_mapping pm ON cdc.cicd_scope_id = pm.row_id
LEFT JOIN pagerduty_incidents pd ON cdc.cicd_scope_id = pd.cicd_scope_id
ORDER BY cdc.finished_date