bpftrace中如何正确追踪vfs_read系统调用并获取用户空间缓冲区内容
2025-05-25 13:46:30作者:冯梦姬Eddie
在Linux系统性能分析和调试过程中,bpftrace是一个非常强大的动态追踪工具。本文将深入探讨如何使用bpftrace正确追踪vfs_read系统调用,并获取用户空间缓冲区内容的技术细节。
问题背景
vfs_read是Linux内核中负责文件读取操作的核心函数,其函数签名为:
ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)
其中buf参数是一个指向用户空间缓冲区的指针,标记为__user,这意味着它指向的是用户空间内存而非内核空间内存。在bpftrace中直接读取这类指针内容时,需要特别注意其特殊性。
常见错误做法
许多开发者初次尝试时可能会编写类似下面的bpftrace脚本:
kprobe:vfs_read
{
@buf[tid] = arg1; // 保存缓冲区指针
}
kretprobe:vfs_read
{
printf("Buffer: %s\n", str(@buf[tid], 40));
}
这种写法会导致以下问题:
- 直接使用
str()函数尝试读取用户空间指针 - 可能得到全零或乱码的输出
- 出现"Numerical result out of range"警告
正确解决方案
正确的做法是使用uptr()函数明确指示这是一个用户空间指针:
kprobe:vfs_read
{
@buf[tid] = arg1;
}
kretprobe:vfs_read
{
printf("Buffer: %s\n", str(uptr(@buf[tid]), 40));
}
或者使用buf()函数以十六进制形式查看内容:
kretprobe:vfs_read
{
printf("Buffer: %rh\n", buf(uptr(@buf[tid]), 40);
}
技术原理
-
用户空间与内核空间区别:Linux采用虚拟内存管理,用户空间和内核空间有不同的地址映射。直接在内核上下文中访问用户空间指针需要使用专门的API。
-
bpftrace的uptr函数:
uptr()是bpftrace提供的辅助函数,它会生成使用bpf_probe_read_user_str()的代码,确保正确地从用户空间读取数据。 -
错误代码-34:当直接读取用户空间指针时出现的-34错误对应EINVAL(无效参数),这是因为内核安全检查失败。
最佳实践建议
- 对于所有可能指向用户空间的指针,始终使用
uptr()包装 - 在开发阶段使用
-kk选项查看详细错误信息 - 对于二进制数据,优先使用
buf()而非str() - 考虑使用kfunc替代kprobe,可能获得更好的类型信息
完整示例脚本
#!/usr/bin/env bpftrace
kprobe:vfs_read
/ pid == $1 /
{
@file[tid] = arg0;
@buf[tid] = arg1;
@count[tid] = arg2;
@pos[tid] = arg3;
}
kretprobe:vfs_read
/ @file[tid] && @buf[tid] && @count[tid] && @pos[tid] /
{
printf("Filename: %s, Buffer: %s, Count: %d, Pos: %d\n",
str(((struct file *)@file[tid])->f_path.dentry->d_name.name),
str(uptr(@buf[tid]), 40),
@count[tid],
*@pos[tid]
);
delete(@file[tid]); delete(@buf[tid]); delete(@count[tid]); delete(@pos[tid]);
}
END
{
clear(@file); clear(@buf); clear(@count); clear(@pos);
}
通过理解这些技术细节,开发者可以更有效地使用bpftrace来追踪和分析Linux系统的文件读取操作。记住,正确处理用户空间指针是编写可靠追踪脚本的关键。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0207
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0133
MinerUA high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。Python08
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
wgai开箱即用的JAVAAI在线训练识别平台&OCR平台AI合集包含旦不仅限于(车牌识别、安全帽识别、抽烟识别、常用类物识别等) 图片和视频识别,可自主训练任意场景融合了AI图像识别opencv、yolo、ocr、esayAI内核识别;AI智能客服、AI语言模型、 无任何第三方API接口可定制化自主离线化部署并自主化行业化使用避免占用内存、GPU消耗训练与识别分开使用;Java05
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
deepin linux kernel
C
32
16
暂无描述
Dockerfile
772
5.05 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
869
1.99 K
Ascend Extension for PyTorch
Python
748
931
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
694
1.37 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
468
461
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.03 K
268
昇腾LLM分布式训练框架
Python
181
225
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.09 K
1.14 K
CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。
Jupyter Notebook
363
132