Async-profiler中使用内核跟踪点(tracepoint)的实践指南

2025-05-28 07:44:55作者：裴麒琰

背景介绍

Async-profiler作为一款强大的Java性能分析工具，除了支持常规的CPU和内存分析外，还提供了对Linux内核跟踪点(tracepoint)的支持。这为开发者提供了深入观察系统调用的能力，例如监控文件打开操作(sys_enter_open)等。然而在实际使用中，用户可能会遇到"Unsupported event type"的错误提示。

问题本质

这个问题的根源在于async-profiler需要通过debugfs文件系统解析跟踪点的符号名称。在Linux系统中，debugfs通常挂载在/sys/kernel/debug目录下，而普通用户通常没有访问权限。即使使用sudo运行asprof启动器，解析过程仍然会在目标Java进程的上下文中进行，而不是在启动器的上下文中。

解决方案

临时解决方案

对于当前版本，可以采用手动解析跟踪点ID的方式：

首先获取特定跟踪点的ID：

sudo cat /sys/kernel/debug/tracing/events/syscalls/sys_enter_openat/id

然后将获取到的ID用于分析命令：

asprof -e trace:[ID] --cstack dwarf -d 30 -f flamegraph.html [PID]

长期解决方案

最新版本的async-profiler已经修复了这个问题。现在用户可以直接使用：

sudo asprof -e syscalls:sys_enter_openat ...

即使目标Java进程运行在非特权用户下也能正常工作。

使用注意事项

debugfs挂载检查：确保/sys/kernel/debug/tracing目录存在。如果不存在，需要先挂载debugfs：

mount -t debugfs none /sys/kernel/debug

系统调用选择：在现代glibc中，open()函数通常通过openat系统调用实现，而非直接的open。因此，如果syscalls:sys_enter_open没有显示预期结果，可以尝试分析syscalls:sys_enter_openat。
调用栈收集：建议配合--cstack dwarf参数使用，以获取更完整的调用栈信息。