Valkey 8.1.0 在s390x和ppc64le架构下的编译问题分析

2025-05-10 10:56:33作者：幸俭卉

在Valkey 8.1.0版本发布后，开发团队发现该版本在s390x和ppc64le架构的Fedora平台上无法正常编译。这个问题主要出现在内存分配模块(zmalloc.c)中，涉及到多线程环境下的内存使用统计机制。

问题现象

编译过程中出现的核心错误信息是类型不匹配：

zmalloc.c:107:37: error: initialization of 'size_t *' from incompatible pointer type '_Atomic size_t *'

这个错误表明在变量初始化时，尝试将一个原子类型的指针赋值给非原子类型的指针，这在C语言中是不允许的，因为它们的类型不兼容。

技术背景

Valkey使用了一个巧妙的设计来统计各个线程的内存使用情况。为了在多线程环境下高效准确地统计内存使用，代码中实现了一个线程局部存储的计数器数组。这个设计需要考虑两个关键因素：

缓存行对齐：防止多个线程访问同一个缓存行导致的伪共享问题
原子性保证：确保计数器更新的原子性，避免数据竞争

在x86、ARM等常见架构上，由于这些平台的内存访问模型提供了较强的顺序一致性保证，Valkey通过简单的内存对齐就能满足需求。但对于其他架构，则需要显式使用原子操作来确保正确性。

问题根源

问题出在zmalloc.c文件中的条件编译逻辑。原始代码将平台分为两类：

已知平台(i386/x86_64/amd64/POWERPC/arm/arm64)：使用普通对齐的内存
其他平台：使用原子对齐的内存

然而，s390x和ppc64le架构虽然属于POWER系列，但在编译时却进入了第二个分支，导致类型不匹配。这表明平台检测逻辑存在缺陷。

解决方案

开发团队提出了一个修复方案，主要修改点是：

将指针变量的声明移到条件编译分支内部
确保每个分支下指针类型与指向的内容类型一致

这个修改既解决了编译错误，又保持了原有的设计意图：对于已知平台使用简单对齐，对于未知平台使用原子操作作为安全后备方案。

更深层次的思考

这个问题引发了对跨平台开发中几个重要方面的思考：

平台特性检测：不能仅依靠架构名称来判断内存模型特性
原子操作的可移植性：C11标准引入的_Atomic虽然提高了可移植性，但仍需注意与旧代码的兼容性
渐进式改进：在性能关键路径上，针对不同平台采用不同实现是合理的，但需要有清晰的文档和测试保障

总结

这个问题的解决过程展示了开源项目中跨平台支持的挑战。Valkey团队通过细致的平台特性分析和谨慎的代码修改，确保了在保持高性能的同时，也能在各种硬件架构上正确运行。这也提醒我们，在现代系统软件开发中，必须充分考虑不同硬件平台的内存模型差异，才能构建出真正健壮的软件。

对于使用Valkey的用户来说，特别是运行在s390x或ppc64le架构上的用户，建议升级到包含此修复的版本，以确保内存统计功能的正确性和稳定性。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677