在LIKWID中访问SPR处理器Uncore计数器的配置指南
2025-07-08 16:34:09作者:尤峻淳Whitney
背景介绍
LIKWID是一款轻量级性能计数器工具集,广泛应用于Linux系统上的性能分析和监控。在使用LIKWID监控Intel Sapphire Rapids(SPR)处理器时,用户可能会遇到无法访问Uncore计数器的问题。本文将详细介绍如何正确配置系统以启用对SPR处理器Uncore计数器的访问。
系统要求与准备工作
要使用LIKWID访问SPR处理器的性能计数器,需要满足以下条件:
- 内核版本:建议使用较新的Linux内核(如5.15或更高版本)
- MSR模块:确保加载了msr内核模块并正确配置权限
- 安全启动:必须禁用安全启动功能
- 内核参数:需要在启动时添加
msr.allow_writes=on参数
详细配置步骤
1. 验证内核启动参数
首先需要确认系统已正确配置了MSR写入权限。可以通过以下命令检查:
sudo dmesg | grep allow_writes
预期输出应显示msr.allow_writes=on参数已启用。
2. 设置MSR设备权限
确保/dev/cpu/*/msr设备文件具有正确的权限设置:
sudo chmod 666 /dev/cpu/*/msr
3. LIKWID安装配置
在编译安装LIKWID时,需要特别注意访问模式的配置。对于SPR处理器,推荐使用以下两种模式之一:
-
accessdaemon模式:
- 安装时指定
ACCESSMODE=accessdaemon - 需要为
likwid-accessD程序设置SUID权限 - 需要配置适当的Linux能力(capabilities)
- 安装时指定
-
direct模式:
- 安装时指定
ACCESSMODE=direct - 需要为相关LIKWID工具设置Linux能力
- 安装时指定
4. Linux能力配置
对于accessdaemon模式,需要为likwid-accessD配置以下能力:
sudo setcap cap_sys_rawio,cap_sys_admin,cap_dac_override=ep /path/to/likwid-accessD
对于direct模式,需要为相关工具(如likwid-perfctr)配置相同的能力集。
常见问题排查
如果在配置后仍然无法访问Uncore计数器,可以尝试以下排查步骤:
-
启用详细日志:
likwid-perfctr -V 3 -C 0 -g MEM ls这将输出详细的调试信息,帮助定位问题。
-
检查系统日志:
sudo tail -f /var/log/syslog查看是否有与MSR访问相关的错误信息。
-
验证能力设置:
getcap /path/to/likwid-accessD确认能力已正确设置。
安全注意事项
- 使用
cap_dac_override能力会带来安全风险,因为它允许绕过文件权限检查 - 在生产环境中,建议优先使用accessdaemon模式而非direct模式
- 确保只有授权用户能够运行LIKWID工具
总结
通过正确配置内核参数、设备权限和Linux能力,可以成功启用LIKWID对SPR处理器Uncore计数器的访问。建议用户根据实际需求和安全考虑选择合适的访问模式,并遵循最小权限原则进行配置。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0231
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
JoyAI-VL-Interaction-Preview京东开源首个开源、视觉驱动的实时交互模型——它能实时监控视频流,并自主决定何时发言、保持沉默或委托任务。Jinja00
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0150
kornia🐍 空间人工智能的几何计算机视觉库Python02
PaddleParallel Distributed Deep Learning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署)C++02
项目优选
收起
暂无描述
Dockerfile
782
5.11 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
892
2.06 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
473
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
710
1.43 K
deepin linux kernel
C
32
16
Ascend Extension for PyTorch
Python
763
972
JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。
Python
2.27 K
681
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.11 K
1.15 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
272
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
2.18 K
231