Apache DevLake 中 CircleCI 工作流与作业正则匹配问题解析

2025-07-03 18:06:22作者：牧宁李

Apache DevLake is an open-source dev data platform to ingest, analyze, and visualize the fragmented data from DevOps tools, extracting insights for engineering excellence, developer experience, and community growth.

项目地址：https://gitcode.com/gh_mirrors/incu/incubator-devlake

Apache DevLake 作为开源的数据湖平台，在收集和分析 DevOps 数据时，用户可能会遇到 CircleCI 工作流与作业的正则匹配不一致问题。本文将深入分析这一问题的技术背景、产生原因及解决方案。

问题现象

在 DevLake 的配置界面中，用户设置正则表达式用于匹配 CircleCI 的工作流和作业时，发现工作流能够被正确匹配，但相同正则表达式却无法匹配到作业数据。这导致 DORA 指标无法正确显示相关部署数据。

技术背景

DevLake 通过 Scope Config 中的正则表达式来识别 CircleCI 的工作流和作业，将其分类为部署等类型。这一过程涉及多个数据表转换：

原始数据首先被收集到 _tool_circleci_jobs 表
经过转换后进入 cicd_tasks 表
最后由 DORA 插件处理生成 cicd_deployments 和 cicd_deployment_commits 表

问题根源

经过分析，该问题源于以下技术细节：

正则匹配逻辑差异：工作流和作业的匹配逻辑在代码实现上存在不一致
数据转换流程：虽然数据能够进入 cicd_tasks 表，但后续的 DORA 指标转换可能存在问题
配置理解误区：用户容易误解"工作流或作业"的匹配逻辑，实际上需要确保正则能同时匹配两种场景

解决方案

针对这一问题，开发团队已经提出了修复方案：

代码修复：调整作业收集器的实现，确保工作流和作业使用相同的匹配逻辑
配置建议：推荐使用更全面的正则表达式，如 (?i)(deploy-job) 形式，确保能匹配到工作流和作业名称
验证流程：通过检查 cicd_tasks 表中的记录类型是否为 DEPLOYMENT 来验证配置是否生效

最佳实践

为避免类似问题，建议用户：

使用更宽泛的正则表达式，如 (.*deploy.*) 来捕获各种命名变体
在配置后，依次检查 _tool_circleci_jobs、cicd_tasks 和 cicd_deployments 表的数据
确保 DORA 插件任务在流水线中正确执行

总结

CircleCI 数据收集的正则匹配问题是 DevLake 使用过程中的一个典型配置问题。通过理解数据流转过程和正确配置正则表达式，用户可以确保部署数据被正确识别并显示在 DORA 指标中。开发团队的持续改进也将进一步提升该功能的稳定性和易用性。

incubator-devlake

项目地址：https://gitcode.com/gh_mirrors/incu/incubator-devlake

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

518

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

652

288