Apache Pegasus构建过程中zookeeper-bin缺失问题分析

2025-07-06 04:24:11作者：何举烈Damon

incubator-pegasus

Apache Pegasus - A horizontally scalable, strongly consistent and high-performance key-value store

项目地址：https://gitcode.com/gh_mirrors/in/incubator-pegasus

问题背景

在Apache Pegasus项目的持续集成构建过程中，开发团队发现了一个影响构建流程稳定性的问题。当执行GitHub Actions工作流时，构建步骤会失败并报错"zookeeper-bin: Cannot stat: No such file or directory"。这个问题直接影响了项目的自动化构建和测试流程。

问题现象

构建日志显示，在执行打包操作时，系统尝试将多个组件打包成tar.gz文件，其中包括：

build/latest/output目录下的构建输出
build/latest/bin目录下的二进制文件
hadoop-bin目录
zookeeper-bin目录

然而，打包过程在尝试包含zookeeper-bin目录时失败，提示该目录不存在。值得注意的是，hadoop-bin目录能够被正常找到并打包，只有zookeeper-bin目录出现了问题。

根本原因分析

经过深入调查，发现问题的根源在于项目的构建缓存机制：

第三方依赖管理机制：Pegasus项目使用thirdparty目录来管理第三方依赖项，包括zookeeper等组件。
条件性复制逻辑：构建脚本中有一个关键逻辑——只有当thirdparty目录内容发生变化时，才会将zookeeper-bin目录复制到构建目录中。如果thirdparty目录没有变化，则不会执行复制操作。
GitHub Actions的缓存行为：GitHub Actions会缓存某些目录以加速构建过程。当thirdparty目录未被修改时，构建流程会跳过zookeeper-bin的复制步骤，但后续的打包操作仍然会尝试包含这个目录，导致失败。

解决方案

针对这个问题，开发团队实施了以下解决方案：

构建脚本优化：修改构建脚本，使其在打包前检查zookeeper-bin目录是否存在。如果目录不存在，则不尝试将其包含在最终的打包文件中。
依赖管理改进：确保所有必要的依赖项都有明确的获取路径，避免依赖隐式的目录复制逻辑。
构建流程文档化：更新项目文档，明确说明构建过程中对第三方依赖的处理方式，帮助开发者更好地理解构建流程。

技术启示

这个案例为我们提供了几个重要的技术启示：

构建系统的健壮性：构建脚本应该能够处理各种边界情况，包括依赖项缺失的情况，而不是假设所有依赖都会按预期存在。
缓存机制的副作用：在使用构建缓存时，需要特别注意它可能带来的副作用，特别是那些依赖于文件系统状态的构建步骤。
显式优于隐式：在构建系统中，显式声明依赖关系比依赖隐式的文件系统状态更加可靠。

总结

Apache Pegasus项目中遇到的这个构建问题，虽然表面上看只是一个简单的文件缺失问题，但实际上反映了构建系统设计中需要考虑的多个方面。通过分析这个问题，我们不仅解决了当前的构建失败，还改进了项目的整体构建流程，使其更加健壮和可靠。这对于保证项目的持续集成和持续交付能力具有重要意义。

incubator-pegasus

Apache Pegasus - A horizontally scalable, strongly consistent and high-performance key-value store

项目地址：https://gitcode.com/gh_mirrors/in/incubator-pegasus

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

昇腾LLM分布式训练框架