Velox项目在ARM64架构下的构建问题分析与解决

2025-06-19 13:39:43作者：丁柯新Fawn

A C++ vectorized database acceleration library aimed to optimizing query engines and data processing systems.

项目地址：https://gitcode.com/gh_mirrors/vel/velox

背景介绍

Velox是一个高性能的向量化执行引擎，由Facebook开源并孵化。作为大数据处理领域的重要组件，Velox需要支持多种硬件架构，包括x86和ARM64。在跨平台支持过程中，开发者可能会遇到各种构建问题，特别是在ARM64架构下。

问题现象

在GitHub托管的Ubuntu ARM64运行器上构建Velox时，会出现链接错误，提示找不到一系列与内存操作相关的符号引用，包括__folly_memcpy_aarch64、__folly_memmove_aarch64等。这些错误发生在链接阶段，表明Velox依赖的Folly库中存在未定义的符号。

技术分析

根本原因

这个问题源于Velox依赖的Folly库版本(v2024.07.01.00)中的一个已知问题。Folly是Facebook开发的一个C++库集合，提供了各种基础功能。在ARM64架构下，Folly实现了一些特定于该架构的内存操作优化函数，但在早期版本中，这些函数的定义和导出存在问题。

具体细节

符号缺失：错误信息中提到的__folly_mem*系列函数是Folly为ARM64架构特别优化的内存操作函数，包括普通版本、SVE(可伸缩向量扩展)版本和SIMD版本。
版本依赖：Folly在v2024.07.15.00版本中修复了这个问题，但Velox当时依赖的是较早的v2024.07.01.00版本。
架构特性：ARM64架构提供了多种向量化指令集(SVE/SIMD)，Folly利用这些特性实现了高性能的内存操作函数，但在早期版本中这些实现没有被正确导出。

解决方案

版本升级

最直接的解决方案是将Velox依赖的Folly版本升级到v2024.07.15.00或更高版本。这个版本包含了修复该问题的提交(c30d49dcdc877b38d99b253b8c66ad1853085e09)。

构建配置调整

如果暂时无法升级Folly版本，可以考虑以下替代方案：

禁用特定优化：在构建配置中禁用Folly的ARM64特定内存操作优化。
自定义链接：提供缺失符号的自定义实现或链接到系统提供的标准内存操作函数。

技术影响

性能考虑：使用修复后的版本可以确保在ARM64架构上获得最佳的内存操作性能。
兼容性：这个问题只影响ARM64架构下的构建，x86架构不受影响。
构建系统：需要确保构建系统能够正确处理跨平台依赖和符号导出。

最佳实践建议

定期更新依赖：保持对关键依赖库(如Folly)的定期更新，以获取性能改进和错误修复。
跨平台测试：在CI/CD流水线中包含多种架构的构建测试，及早发现平台相关问题。
版本锁定：在解决特定平台问题时，明确记录所需的依赖版本，避免后续回归。

总结

Velox在ARM64架构下的构建问题展示了跨平台开发中常见的依赖管理挑战。通过理解底层技术细节和及时更新依赖版本，开发者可以有效地解决这类问题。对于大数据处理系统而言，确保在所有支持架构上的稳定构建是保证系统可靠性和性能的重要前提。

A C++ vectorized database acceleration library aimed to optimizing query engines and data processing systems.

项目地址：https://gitcode.com/gh_mirrors/vel/velox

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统