Highway项目在Debian/armhf平台构建失败问题分析

2025-06-12 21:18:59作者：曹令琨Iris

问题背景

在Debian/armhf平台上构建Highway 1.1.0版本时，出现了测试用例失败的情况。具体表现为三个测试用例在EMU128目标下异常终止，涉及浮点运算和排序算法相关功能。

错误现象

构建过程中出现的具体错误包括：

HwyWidenMulTestGroup测试组中的SumOfMulQuadAccumulate测试失败
SortTestGroup测试组中的FloatInf测试失败
SortTestGroup测试组中的基础排序测试失败

所有失败测试都发生在EMU128仿真环境下，错误提示显示子进程异常终止。

问题排查过程

开发人员首先怀疑这与之前报告的树向量化优化问题类似，但经过验证发现：

构建日志中已经包含了-fno-tree-vectorize编译选项
这表明这是一个与之前不同的问题

随后尝试降低优化级别进行测试：

使用-O1优化级别时，出现了新的整数除法运算错误
错误表现为NEON_WITHOUT_AES目标下的64位整数除法结果不正确
预期结果为0x1，但实际得到0x1fd

最终解决方案：

使用-O0优化级别（完全禁用优化）后，所有测试通过
这表明问题与编译器优化密切相关

技术分析

在ARM架构上，特别是armhf（硬浮点）环境下，编译器优化可能会对SIMD指令和浮点运算产生意外影响。这种情况通常由以下原因导致：

编译器优化缺陷：某些优化可能会错误地重新排序或转换SIMD指令
浮点精度问题：优化可能改变浮点运算的执行顺序或精度
寄存器分配问题：优化可能导致寄存器使用冲突或不正确的值保留

解决方案建议

对于类似问题，建议采取以下步骤：

首先尝试降低优化级别，确认是否为优化导致的问题
检查特定架构的编译器已知问题
考虑为特定架构添加编译选项或代码修改
在项目文档中记录平台特定的构建要求

结论

本次构建失败问题最终通过完全禁用编译器优化得到解决。这反映了在交叉平台开发中，特别是在ARM架构上，编译器优化可能带来的挑战。项目维护者需要考虑为不同平台提供特定的构建配置建议，以确保兼容性。

对于长期解决方案，建议：

向GCC编译器团队报告此优化问题
在项目中添加armhf平台的CI测试
考虑为关键算法提供优化级别无关的实现

highway

性能可移植的、长度无关的SIMD

项目地址：https://gitcode.com/GitHub_Trending/hi/highway

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781