Apache DevLake DORA 仪表盘性能优化实践
2025-06-29 16:21:08作者:滑思眉Philip
背景介绍
Apache DevLake 是一个开源的数据湖平台,用于收集、分析和可视化软件开发过程中的各项指标。其中 DORA(DevOps Research and Assessment)仪表盘是核心功能之一,用于展示研发效能的关键指标。
性能问题分析
在 v1.0.1-beta5 版本中,DORA 仪表盘的两个关键面板"Overall DORA Metrics"和"Change Failure Rate"存在严重的性能问题。原始SQL查询执行时间长达31.7秒,严重影响用户体验。
通过分析发现,问题出在以下SQL查询结构上:
SELECT
CASE
WHEN COUNT(i.id) = 0 AND COUNT(cdc.id) = 0 THEN 'No All'
WHEN COUNT(i.id) = 0 THEN 'No Incidents'
WHEN COUNT(cdc.id) = 0 THEN 'No Deployments'
END AS is_collected
FROM
(SELECT 1) AS dummy
LEFT JOIN incidents i ON 1 = 1
LEFT JOIN cicd_deployment_commits cdc ON 1 = 1;
这种写法会导致数据库执行笛卡尔积运算,当incidents表有3193条记录,cicd_deployment_commits表有177462条记录时,会产生约567亿条中间结果,造成巨大的计算开销。
优化方案
优化思路
- 避免全表连接:原始查询无条件连接两个大表,这是性能瓶颈的根本原因
- 提前聚合:先对两个表分别进行计数,再进行结果合并
- 添加过滤条件:结合项目筛选和时间范围过滤,减少数据处理量
优化后的SQL
SELECT
CASE
WHEN i.cnt = 0 AND cdc.cnt = 0 THEN 'No All'
WHEN i.cnt = 0 THEN 'No Incidents'
WHEN cdc.cnt = 0 THEN 'No Deployments'
END AS is_collected
FROM
(
SELECT COUNT(*) AS cnt FROM incidents i
JOIN project_mapping pm ON i.scope_id = pm.row_id AND pm.`table` = i.`table`
WHERE pm.project_name IN (${project}) AND $__timeFilter(i.created_date)
) AS i
LEFT JOIN (
SELECT COUNT(*) AS cnt FROM cicd_deployment_commits cdc
JOIN project_mapping pm ON cdc.cicd_scope_id = pm.row_id AND pm.`table` = 'cicd_scopes'
WHERE pm.project_name IN (${project}) AND $__timeFilter(cdc.finished_date)
) AS cdc ON 1 = 1;
优化效果
优化后的查询执行时间从31.7秒降低到0.02秒,性能提升了约1500倍。这主要得益于:
- 消除了笛卡尔积运算
- 利用了索引扫描(incidents_resolution_date_idx和cicd_deployment_commits_finished_date_idx)
- 减少了中间结果集的大小
技术要点
- SQL优化原则:避免不必要的表连接,特别是无条件连接大表
- Grafana最佳实践:合理使用模板变量(如__timeFilter)
- 数据模型理解:正确关联project_mapping表以支持多项目筛选
- 索引利用:确保查询能够利用现有索引提高效率
总结
通过对DORA仪表盘SQL查询的重构,我们解决了性能瓶颈问题。这个案例展示了在数据可视化场景中,SQL查询优化的重要性。开发者在编写类似查询时,应该:
- 始终考虑数据量和连接方式的影响
- 优先使用过滤条件减少数据处理量
- 合理利用数据库索引
- 避免产生不必要的中间结果
这种优化思路不仅适用于Apache DevLake项目,对于其他需要处理大量数据的仪表盘开发也具有参考价值。
登录后查看全文
热门项目推荐
相关项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0230- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01- IinulaInula(发音为:[ˈɪnjʊlə])意为旋覆花,有生命力旺盛和根系深厚两大特点,寓意着为前端生态提供稳固的基石。openInula 是一款用于构建用户界面的 JavaScript 库,提供响应式 API 帮助开发者简单高效构建 web 页面,比传统虚拟 DOM 方式渲染效率提升30%以上,同时 openInula 提供与 React 保持一致的 API,并且提供5大常用功能丰富的核心组件。TypeScript05
热门内容推荐
最新内容推荐
BongoCat性能优化:从交互卡顿到丝滑体验的技术实践OpCore Simplify技术指南:零基础构建稳定黑苹果系统的完整方案JarkViewer:多格式图片浏览与专业处理的轻量解决方案提升数字书写效率的5款必备应用:从痛点到解决方案告别云端依赖:本地语音识别的革命性解决方案VirtualApp从入门到精通:Android沙盒技术实战指南开源工具赋能老旧设备:OpenCore Legacy Patcher系统升级全指南企业内网环境下的服务器管理平台搭建:宝塔面板v7.7.0离线部署全攻略革命性突破:Dexter如何通过自主智能代理重塑金融研究效率工具当Vite遇上微前端:90%开发者都会踩的3个技术坑与vite-plugin-qiankun解决方案
项目优选
收起
deepin linux kernel
C
27
13
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
629
4.15 K
Ascend Extension for PyTorch
Python
469
566
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
931
826
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.51 K
855
昇腾LLM分布式训练框架
Python
138
162
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
131
191
暂无简介
Dart
877
209
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
382
266
AscendNPU-IR是基于MLIR(Multi-Level Intermediate Representation)构建的,面向昇腾亲和算子编译时使用的中间表示,提供昇腾完备表达能力,通过编译优化提升昇腾AI处理器计算效率,支持通过生态框架使能昇腾AI处理器与深度调优
C++
114
186