Apache Arrow C++测试构建中因计算模块关闭导致的测试失败问题分析

2025-05-14 03:03:11作者：蔡怀权

问题背景

在Apache Arrow C++项目的构建过程中，当开发者选择关闭计算模块(ARROW_COMPUTE=OFF)但开启测试构建(ARROW_BUILD_TESTS=ON)时，会出现一个特定的测试用例失败。这个问题源于测试代码对计算模块功能的隐式依赖，特别是在处理run_end_encode函数时。

技术细节

该问题出现在testing/gtest_util_test.cc文件中的RunEndEncodeGtestUtilTest.SchemaTypeIsModified测试用例。当计算模块被禁用时，测试尝试调用run_end_encode函数会失败，因为该函数属于计算模块的功能。

错误信息明确显示：

Key error: No function registered with name: run_end_encode

问题根源

这个问题的根本原因在于测试代码没有正确处理计算模块不可用的情况。在PR #45535的变更后，测试代码假设计算模块总是可用的，没有考虑ARROW_COMPUTE=OFF的构建配置。

解决方案

正确的处理方式应该是在测试代码中添加对计算模块可用性的检查。当计算模块不可用时，测试应该被跳过或标记为成功，而不是尝试执行依赖于计算模块的操作。

最佳实践建议

对于模块化构建的项目，测试代码应该显式检查依赖模块的可用性
测试用例应该明确区分核心功能测试和模块特定功能测试
构建系统应该提供清晰的文档说明模块间的依赖关系
在CI配置中应该包含模块化构建的测试场景

影响范围

该问题主要影响：

使用模块化构建的开发者
需要禁用计算模块的特殊场景
希望运行核心功能测试但不需计算功能的用户

总结

这个问题展示了在大型C++项目中模块化构建和测试的重要性。Apache Arrow作为数据处理领域的核心库，其模块化设计允许用户根据需要选择功能组件，但同时也带来了测试复杂度的增加。通过正确处理模块依赖关系，可以确保构建配置的灵活性不会影响核心功能的可靠性。

arrow

Apache Arrow is the universal columnar format and multi-language toolbox for fast data interchange and in-memory analytics

项目地址：https://gitcode.com/GitHub_Trending/arrow3/arrow

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

473

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

272