Apache DevLake v1.0.2-beta6版本发布：数据采集与治理能力再升级

2025-06-18 12:32:34作者：温艾琴Wonderful

Apache DevLake is an open-source dev data platform to ingest, analyze, and visualize the fragmented data from DevOps tools, extracting insights for engineering excellence, developer experience, and community growth.

项目地址：https://gitcode.com/gh_mirrors/in/incubator-devlake

Apache DevLake作为一款开源的数据湖平台，专注于为开发者提供高效、灵活的数据采集、转换和分析能力。该项目通过统一的接口和标准化的数据处理流程，帮助团队整合来自不同工具和系统的数据，为软件研发效能度量提供有力支撑。最新发布的v1.0.2-beta6版本带来了一系列功能增强和问题修复，进一步提升了系统的稳定性和可用性。

核心功能改进

本次版本在多个插件和功能模块上进行了优化。Zentao插件新增了对issue-repo-commit数据的采集能力，使得禅道系统中的问题与代码仓库提交记录能够建立更完整的关联关系。Customize插件则增加了对增量CSV上传的支持，为用户提供了更灵活的数据导入方式。StarRocks插件通过添加表配置功能，增强了与这一高性能分析型数据库的集成能力。

数据采集质量提升

在数据采集方面，开发团队修复了多个关键问题。GitLab插件解决了合并请求(MR)注释丢失的问题，确保了代码审查数据的完整性。Jira插件优化了冲刺(sprint)数据的采集逻辑，修复了开始日期为空的情况。Opsgenie插件则完善了问题分配者信息的采集，增加了AssigneeId和AssigneeName字段，使事件管理数据更加完整。

系统稳定性增强

本次更新特别关注了系统的稳定性问题。框架层修复了PostgreSQL数据库中更新is_failed字段时的错误问题，提升了数据库操作的可靠性。任务收集器增加了分页支持，有效防止大数据量场景下的性能问题。TAPD插件解决了在计算前置时间(lead time)分钟数时的溢出问题，确保了度量指标的准确性。