OpenBLAS在s390x架构Z13内核上的测试失败问题分析

2025-06-01 10:19:00作者：乔或婵

OpenBLAS作为一个高性能线性代数计算库，其代码优化针对不同硬件架构进行了深度适配。近期在s390x架构的Z13内核上发现了测试用例失败的问题，本文将深入分析该问题的技术背景和解决方案。

问题现象

在s390x架构的Z13内核环境下，执行OpenBLAS扩展测试套件(openblas_utest_ext)时出现多个测试用例失败。具体表现为：

基础运算测试失败：包括ssum、dsum等单精度和双精度求和运算
复数运算测试失败：scsum、dzsum等复数求和运算
测试差异明显：预期值与实际值差异较大，如预期0.0但得到50.0等

技术背景

s390x是IBM大型机系统使用的64位架构，其Z13是该架构的一个具体实现版本。OpenBLAS针对不同s390x微架构提供了专门的优化：

ZARCH_GENERIC：通用实现
Z13：针对z13架构的优化
Z14：针对z14架构的优化

问题根源分析

通过测试失败模式分析，可以确定问题出在Z13内核的SUM运算内核实现上。具体表现为：

内核指派错误：Z13配置中将SUM运算错误地指向了ASUM运算内核
运算逻辑差异：ASUM计算的是绝对值之和，而SUM需要计算代数和的绝对值
复数处理不当：复数运算中实部和虚部的处理存在逻辑错误

解决方案

针对这一问题，OpenBLAS维护者提出了明确的修复方案：

修正内核指派：确保Z13配置中SUM运算指向正确的内核实现
独立实现：为SUM运算提供专门优化的内核代码，而非复用ASUM实现
测试验证：增加针对不同s390x微架构的CI测试覆盖

经验总结

这一案例提供了几个重要的技术经验：

架构特定优化需要全面测试：不同微架构的优化代码需要独立验证
内核复用需谨慎：看似相似的运算可能有本质区别
CI环境建设：需要覆盖所有目标架构的测试环境

对于使用OpenBLAS的开发者和系统集成商，建议在s390x环境中：

明确指定目标微架构
全面运行测试套件
关注特定架构的已知问题

该问题的修复将提升OpenBLAS在IBM Z系列大型机上的数值计算准确性和可靠性，特别是对于金融、科学计算等关键应用场景。

OpenBLAS

OpenBLAS is an optimized BLAS library based on GotoBLAS2 1.13 BSD version.

项目地址：https://gitcode.com/gh_mirrors/op/OpenBLAS

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

TypeScript

1.2 K

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

364

234

OpenBLAS在s390x架构Z13内核上的测试失败问题分析

问题现象

技术背景

问题根源分析

解决方案

经验总结

热门内容推荐

最新内容推荐

项目优选

OpenBLAS在s390x架构Z13内核上的测试失败问题分析

问题现象

技术背景

问题根源分析

解决方案

经验总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选