Highway项目EMU128测试失败问题分析与解决方案

2025-06-12 02:04:04作者：丁柯新Fawn

问题背景

在构建Google Highway项目时，开发者遇到了EMU128目标测试失败的问题。这些问题主要出现在Windows 11系统上，使用CMake 3.31.0和Visual Studio 2022构建工具链时发生。测试失败表现为多种数学运算结果与预期不符，包括NaN检测、指数函数计算和浮点数转换等。

错误现象分析

测试失败的具体表现包括：

NaN检测失败：EMU128目标在测试AllNaN时，未能正确识别NaN值，反而返回了最大浮点数值
指数函数计算错误：Expm1函数在输入较大负值时返回-INF而非预期的-1.0
浮点数转换精度问题：f32x4类型转换时出现精度损失，实际结果与预期存在微小差异
乘法累加运算错误：ReorderWidenMulAccumulate测试中结果完全错误

这些错误都集中在EMU128目标上，而SSE2目标的相同测试则全部通过，表明问题特定于软件模拟实现。

根本原因

经过深入分析，这些问题主要由以下因素导致：

编译器兼容性问题：Visual C++ 2022对某些数学运算的模拟实现与标准存在差异
浮点异常处理：在模拟环境下，某些极端值的处理方式与硬件实现不同
精度控制差异：软件模拟的浮点运算精度控制与硬件存在细微差别

解决方案

针对这些问题，项目维护者提供了两种解决方案：

方案一：更新代码库

将项目更新至最新主分支（commit 28c442f或更新），该版本已包含针对EMU128目标的修复：

修正了hwy/tests/hwy_gtest.h中的测试断言逻辑
优化了数学运算的模拟实现
改进了浮点异常处理

方案二：禁用问题目标

对于x86_64平台用户，可以安全地禁用EMU128和SCALAR目标，因为所有x86_64 CPU都保证支持SSE2指令集。通过在CMake配置中添加以下选项实现：

-DCMAKE_CXX_FLAGS="-DHWY_DISABLED_TARGETS=0x6000000000000000"

技术建议

测试策略：在持续集成环境中，建议同时运行硬件目标和软件模拟目标测试，但允许模拟目标有更大的误差容限
构建配置：对于性能关键应用，建议优先使用硬件加速目标
浮点运算：在模拟环境下使用高精度数学函数时，应注意设置合理的误差阈值

结论

Google Highway项目中的EMU128测试失败问题主要源于编译器兼容性和软件模拟实现的差异。通过更新代码库或选择性禁用问题目标，开发者可以顺利构建项目。这一案例也提醒我们，在跨平台开发中，需要特别注意不同编译器和运行环境下的数学运算行为差异。

highway

Performance-portable, length-agnostic SIMD with runtime dispatch

项目地址：https://gitcode.com/GitHub_Trending/hi/highway

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

458

446

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

255