LIKWID项目在AMD Zen4架构上的内存带宽监控问题解析

2025-07-08 02:10:17作者：傅爽业Veleda

Performance monitoring and benchmarking suite

项目地址：https://gitcode.com/gh_mirrors/li/likwid

背景介绍

LIKWID是一款广泛应用于高性能计算领域的性能监控工具，它能够提供处理器性能计数器数据的精确采集。在最新一代AMD EPYC处理器（基于Zen4架构）上，用户报告了使用LIKWID监控内存带宽时出现的问题——MEM1和MEM2组返回的带宽数据始终为零。

问题现象

多位用户在不同型号的AMD Zen4处理器上遇到了相同的问题：

AMD EPYC 9654（96核）处理器上，MEM1和MEM2组返回的内存带宽数据为零
AMD EPYC 9554（64核）处理器上也出现相同情况
即使设置了/proc/sys/kernel/perf_event_restrict为0，问题依然存在

技术分析

经过深入调查，开发团队发现了问题的根本原因：

计数器映射缺失：在Zen4架构的计数器映射表中缺少了PMC17的索引定义，导致无法正确访问数据交换结构(Data Fabric)的计数器。
内存通道数量变化：Zen4架构处理器支持12个内存通道，而LIKWID原先的实现仅支持8个通道的监控。
事件定义更新：Zen4架构中原来的MEM1和MEM2组使用的事件已不再适用，需要采用新的性能监控事件。

解决方案

开发团队实施了以下修复措施：

完善计数器映射：补充了PMC17的索引定义，确保所有数据交换结构计数器都能被正确访问。
增加通道支持：将内存通道监控扩展到12个，完整支持Zen4架构的内存子系统。
更新监控组：
- 弃用MEM1和MEM2组
- 引入新的MEMREAD和MEMWRITE组
- 采用AMD官方文档中推荐的内存流量监控指标

验证结果

修复后的版本经过测试验证：

能够正确采集所有12个内存通道的数据
内存带宽读数与标准测试工具(如Stream)的结果基本一致
性能监控数据更加准确可靠

技术建议

对于需要在AMD Zen4架构上使用LIKWID进行内存性能分析的用户：

确保使用最新版本的LIKWID工具
优先使用MEMREAD和MEMWRITE组替代原来的MEM1/MEM2组
检查内核版本是否足够新，以支持Zen4架构的所有性能监控功能
确认/proc/sys/kernel/perf_event_restrict设置为0

未来展望

虽然当前问题已解决，但仍有进一步优化的空间：

考虑添加内存控制器(UMC)性能计数器的支持
探索更精细的内存访问模式分析能力
持续跟进AMD处理器架构的演进，及时更新性能监控策略

通过这次问题的解决，LIKWID工具对AMD最新处理器架构的支持得到了显著提升，为高性能计算用户提供了更可靠的性能分析手段。

Performance monitoring and benchmarking suite

项目地址：https://gitcode.com/gh_mirrors/li/likwid

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理