Highway项目在s390x/Z14架构下的编译优化实践

2025-06-12 13:38:06作者：段琳惟

背景介绍

Highway是一个高性能的SIMD（单指令多数据）库，旨在为不同CPU架构提供统一的向量化操作接口。近期在将该项目移植到IBM s390x架构（特别是Z14和Z15处理器）时，开发团队遇到了一些编译优化方面的技术挑战。

技术挑战分析

在s390x/Z14架构上编译Highway项目时，主要遇到了以下两个技术问题：

内联函数优化失败：编译器报告"error: inlining failed in call to 'always_inline'"错误，提示目标特定选项不匹配。这个问题出现在尝试使用CopyBytes模板函数时。
处理器指令集兼容性：需要明确区分Z14和Z15处理器的指令集支持，并正确设置编译选项。

解决方案

经过深入分析，我们确定了以下解决方案：

1. 正确的编译器选项

对于s390x架构，特别是Z14及以后的处理器，必须使用特定的编译选项组合：

-march=z14 -mzvector

这些选项确保编译器：

针对z14架构进行优化
启用z/Architecture向量扩展指令集

2. 处理器目标选择策略

当明确只需要支持z15或更新处理器时，可以禁用z14目标以减少潜在的兼容性问题。但在大多数情况下，同时支持z14和z15是更合理的选择。

性能测试结果

在实际测试中，我们观察到不同处理器架构的性能差异：

------------------------ Z15
       dot:   3456:  0.383 (+/- 0.001)
     delta:   3456:  0.775 (+/- 0.000)

------------------------ Z14
       dot:   3456:  0.088 (+/- 0.001)

值得注意的是，基准测试中偶尔会出现"Measurement failed"警告，这通常是由于测量过程中的噪声（如线程迁移到不同核心）导致的计时偏差，属于正常现象，不影响实际功能。