Apache Kyuubi项目中Gluten集成测试的架构后缀问题解析

2025-07-08 16:05:58作者：翟江哲Frasier

问题背景

在Apache Kyuubi项目中，开发团队为支持Gluten(一个开源的Spark SQL加速引擎)的集成测试，专门设计了kyuubi-gluten-it模块。该模块在构建过程中需要依赖Gluten项目生成的特定JAR包。近期，由于Gluten项目对其打包命名规则进行了调整，导致Kyuubi项目的集成测试出现了构建失败的问题。

问题现象

在Kyuubi项目的持续集成环境中，Gluten集成测试(Gluten Integration TPC-H/DS Test)执行失败。错误信息显示构建系统无法找到预期的Gluten依赖包，具体表现为：

Could not find artifact io.glutenproject:gluten-velox-bundle-spark3.3_2.12-ubuntu_22.04:jar:1.2.0-SNAPSHOT

深入分析后发现，Gluten项目对其打包命名规则进行了变更，在原有的包名基础上增加了架构后缀。例如：

变更前： gluten-velox-bundle-spark3.2_2.12-ubuntu_20.04-1.0.0.jar

变更后： gluten-velox-bundle-spark3.2_2.12-ubuntu_20.04_x86_64-1.0.0.jar

技术影响

这种命名规则的变更对依赖管理产生了直接影响：

构建系统依赖解析：Maven构建系统基于精确的artifactId和版本信息来定位依赖，命名规则的改变导致原有配置无法找到对应资源。
跨平台兼容性：增加架构后缀(_x86_64)虽然提高了包的可识别性，但也要求依赖方必须同步更新其构建配置。
持续集成流程：Kyuubi的CI/CD流程中预设的依赖路径需要相应调整，否则会导致自动化测试失败。

解决方案

针对这一问题，Kyuubi开发团队采取了以下措施：

更新依赖配置：修改kyuubi-gluten-it模块的pom.xml文件，使其与Gluten项目的新命名规则保持一致。
版本兼容处理：考虑到未来可能的架构扩展，在构建配置中增加了对架构后缀的动态支持。
构建路径调整：更新CI脚本中预设的依赖路径，确保能够正确找到带有架构后缀的JAR包。

经验总结

这个问题的解决过程为开源项目间的依赖管理提供了有价值的经验：

接口稳定性：底层库的变更(即使是命名规则)会对上层应用产生连锁反应，需要谨慎评估变更影响。
变更通知机制：跨项目协作时，重大变更应提前通知相关依赖方，给予足够的适配时间。
自动化测试的价值：完善的CI系统能够快速暴露兼容性问题，避免问题流入生产环境。
依赖管理策略：对于关键依赖，可以考虑锁定特定版本或实现更灵活的依赖解析机制。

后续优化

基于此次事件，Kyuubi项目可以考虑：

建立更健壮的依赖解析机制，支持带架构后缀和不带后缀的包名匹配。
完善项目间的变更沟通渠道，确保重要的接口变更能够及时同步。
在文档中明确记录关键依赖的版本兼容性要求，方便后续维护。

这个问题虽然从表面上看只是一个简单的构建失败，但深入分析后可以发现其中涉及开源项目协作、依赖管理、持续集成等多个技术维度，值得开发者们深入思考和借鉴。

kyuubi

Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.

项目地址：https://gitcode.com/gh_mirrors/kyuubi1/kyuubi

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

515

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

284

Apache Kyuubi项目中Gluten集成测试的架构后缀问题解析

问题背景

问题现象

技术影响

解决方案

经验总结

后续优化

热门内容推荐

最新内容推荐

项目优选

Apache Kyuubi项目中Gluten集成测试的架构后缀问题解析

问题背景

问题现象

技术影响

解决方案

经验总结

后续优化

相关内容推荐

热门内容推荐

最新内容推荐

项目优选