Likwid在A64FX处理器上的性能计数器崩溃问题分析

2025-07-08 08:34:20作者：何将鹤

Performance monitoring and benchmarking suite

项目地址：https://gitcode.com/gh_mirrors/li/likwid

问题现象

在A64FX处理器上使用Likwid性能监控工具时，当运行likwid-perfctr -C 0 -g L2 sleep 1命令时会出现内存分配错误，而运行时间稍长的命令如likwid-perfctr -C 0 -g L2 sleep 2则会在输出结果后出现双重释放错误。这两种情况都会导致程序异常终止并产生核心转储。

根本原因

经过深入分析，发现该问题的根源在于A64FX处理器的特殊核心配置。在24核版本的A64FX处理器上（芯片实际有48个节点，但只有24个处于活动状态），Linux内核没有像Intel/AMD平台那样正确地将核心ID映射为连续编号。从调试输出中可以看到，核心ID呈现不连续的跳跃模式（0,1,6,7,8,10等）。

Likwid工具在处理这种非理想的核心拓扑结构时存在缺陷，特别是在以下方面：

核心ID不连续导致的内存分配问题
拓扑结构解析时的假设条件过于理想化
资源释放时的双重释放风险

解决方案

针对这一问题，开发团队提出了核心ID重映射的解决方案。通过修改src/topology_proc.c文件中的核心ID分配逻辑，将原本直接读取系统提供的核心ID改为使用自增的连续编号。这一修改虽然解决了初始的内存分配问题，但揭示了Likwid在处理非标准拓扑结构时更深层次的兼容性问题。

技术启示

这一案例为我们提供了几个重要的技术启示：

硬件兼容性：性能监控工具需要充分考虑不同硬件架构的特殊性，特别是像A64FX这样的非x86架构处理器。
拓扑结构处理：工具在解析系统拓扑结构时，不能假设核心ID、插槽ID等是连续或有序的，需要具备处理各种非理想情况的能力。
资源管理：在复杂的性能监控场景下，需要特别注意资源的分配和释放逻辑，避免内存泄漏或双重释放等问题。

结论

Likwid工具在A64FX处理器上的这一问题凸显了性能监控工具在多架构支持方面的挑战。通过核心ID重映射等解决方案，可以部分缓解问题，但长期来看，工具需要更全面地考虑各种非标准拓扑结构情况，以提高跨平台兼容性。这一案例也为其他性能分析工具的开发提供了有价值的参考。

Performance monitoring and benchmarking suite

项目地址：https://gitcode.com/gh_mirrors/li/likwid

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。