bpftrace项目中runqlat.bt工具运行问题的分析与解决

2025-05-25 18:07:35作者：卓艾滢Kingsley

在Linux系统性能分析领域，bpftrace是一个强大的动态追踪工具，它允许用户通过eBPF技术来监控和分析系统行为。其中runqlat.bt是一个常用的脚本，用于测量CPU调度延迟。然而，在NixOS等特定Linux发行版上运行时，用户可能会遇到内核头文件缺失的问题。

问题现象

当用户在NixOS系统上执行sudo runqlat.bt命令时，会遇到如下错误提示：

WARNING: Could not find kernel headers...
definitions.h:2:10: fatal error: 'linux/sched.h' file not found

值得注意的是，在同一系统上使用bcc工具包中的runqlat工具却可以正常运行。这个现象表明问题与bpftrace的特定实现方式有关。

问题根源

这个问题源于bpftrace v0.20.4版本中的一项安全改进。在该版本中，开发团队移除了自动解压内核头文件的功能，因为这一机制存在潜在的安全风险。而BCC工具包仍然保留了原有的自动解压逻辑，因此不会出现相同的问题。

解决方案

临时解决方案

用户可以通过以下步骤手动解决这个问题：

加载kheaders模块：

sudo modprobe kheaders

解压内核头文件：

sudo tar -xf /sys/kernel/kheaders.tar.xz -C /tmp/headers

指定头文件路径运行脚本：

sudo BPFTRACE_KERNEL_SOURCE=/tmp/headers runqlat.bt

长期解决方案

bpftrace开发团队已经意识到这个问题，并计划从两个方向进行改进：

在错误提示信息中添加更详细的操作指南，明确告诉用户如何手动解压内核头文件。
修改runqlat.bt脚本，减少对内核头文件的依赖。具体来说，将直接定义所需的常量（如TASK_RUNNING），而不是从内核头文件中获取这些定义。

技术背景

这个问题涉及到Linux内核开发中的几个重要概念：

内核头文件：包含了内核数据结构和常量的定义，是开发内核模块和系统工具的基础。
eBPF：一种革命性的内核技术，允许用户空间程序安全高效地访问内核数据和行为。
安全考虑：自动解压内核头文件虽然方便，但可能被恶意利用，因此bpftrace选择移除这一功能以提高安全性。

对开发者的启示

这个问题给开发者带来了一些有价值的思考：

在工具设计中，便利性和安全性往往需要权衡。bpftrace选择牺牲一定的便利性来增强安全性是合理的。
对于系统级工具，应该尽量减少对外部环境的依赖。runqlat.bt未来将减少对内核头文件的依赖，这是很好的改进方向。
清晰的错误提示对于用户体验至关重要。bpftrace团队正在改进错误信息，这将大大降低用户解决问题的难度。

总结

bpftrace作为强大的系统追踪工具，在不断演进中会遇到各种兼容性和安全性挑战。runqlat.bt的问题展示了工具开发中常见的依赖管理难题。通过理解问题的本质和解决方案，用户不仅可以解决当前问题，还能更好地理解Linux系统工具的工作原理。

随着bpftrace的持续改进，这类问题将得到更好的处理，使工具在各种Linux发行版上都能提供一致且安全的用户体验。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

465

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

2.08 K

216