bpftrace中共享探针代码的技术探讨

2025-05-25 21:32:01作者：尤峻淳Whitney

在bpftrace项目中，开发者经常遇到需要在不同探针(hook)之间共享代码的需求。本文深入分析这一技术挑战及其解决方案。

问题背景

当使用bpftrace编写内核追踪脚本时，经常会遇到多个探针需要执行相似逻辑的情况。例如，在追踪TCP发送和接收消息时，kretfunc:tcp_sendmsg和kretfunc:tcp_recvmsg两个探针可能需要访问相同的套接字结构体并提取端口信息。

理想情况下，开发者希望能够像这样共享代码：

kretfunc:tcp_sendmsg,
kretfunc:tcp_recvmsg
{
    // 共享的代码逻辑
}

然而，当前bpftrace会报错"Probe has attach points with mixed arguments"，因为不同探针的参数结构可能不同。

技术挑战分析

bpftrace目前的设计存在几个关键技术限制：

参数处理机制：当前bpftrace假设每个探针类型都有唯一的参数集，并将参数存储在以探针命名的特殊结构类型中。
字段分析器限制：FieldAnalyser目前按探针而非附着点(attach point)处理参数，这使得共享代码变得复杂。
类型系统问题：需要确保不同探针中相同名称的参数具有兼容的类型，这需要更复杂的类型检查机制。

现有解决方案

1. 用户定义函数(UDF)

这是bpftrace长期规划的解决方案，允许开发者定义可重用的函数块，然后在多个探针中调用。

2. 宏语法

最新的bpftrace版本引入了宏语法，可以通过预处理方式减少代码重复。虽然不如真正的函数重用灵活，但在许多场景下已经足够。

#define EXTRACT_PORTS \
    $inet = (struct inet_sock *)args->sk; \
    $lport = bswap($inet->inet_sport); \
    $dport = bswap(args->sk->__sk_common.skc_dport);

kretfunc:tcp_sendmsg { EXTRACT_PORTS printf(...); }
kretfunc:tcp_recvmsg { EXTRACT_PORTS printf(...); }