Pixie项目在6.10及以上内核版本中的Socket Tracer启动问题分析

2025-06-04 11:41:06作者：盛欣凯Ernestine

在Pixie项目的实际部署中，我们发现当运行在6.10及以上版本的Linux内核环境时，Socket Tracer功能无法正常启动。这个问题主要影响使用OpenSUSE MicroOS等较新发行版的用户，特别是在ARM架构的设备上表现尤为明显。

问题现象

当Pixie的PEM（Pixie Edge Module）尝试在6.11内核上启动时，会遭遇多个BPF程序编译失败的情况。错误日志显示，系统无法找到CONFIG_ARM_PAGE_SHIFT定义，同时缺少asm/tlbbatch.h头文件。这些错误直接导致BPF程序初始化失败，进而使得Socket Tracer功能无法正常工作。

根本原因分析

经过深入调查，我们发现问题的根源在于BCC（BPF Compiler Collection）工具链的版本兼容性问题。具体表现为：

内核头文件不匹配：Pixie项目原本提供的Linux内核头文件最高只支持到6.1.x版本，而用户环境运行的是6.11内核，这导致了头文件定义不匹配的问题。
BCC虚拟文件机制：BCC在编译BPF程序时会自动包含一些"虚拟"文件，特别是compat/linux/virtual_bpf.h。这个文件需要与libbpf保持同步，并且其头文件保护宏必须与内核中的include/uapi/linux/bpf.h保持一致。
版本冲突：虽然我们更新了Linux内核头文件，但旧版的BCC仍然会插入一个过时的uapi/linux/bpf.h文件副本，这个旧版本缺少bpf_wq等重要声明，导致编译失败。

解决方案

解决这个问题的关键在于升级BCC工具链：

更新BCC版本：将BCC升级到与6.11内核兼容的版本，确保虚拟文件机制能够正确工作。
同步头文件：确保BCC中的virtual_bpf.h与最新内核中的bpf.h保持同步，特别是头文件保护宏和关键声明。
全面测试：在ARM和x86架构上全面测试新版本的兼容性，确保不会引入新的问题。

技术细节

BPF程序在内核中的运行依赖于精确的内核数据结构定义。当内核版本升级时，这些数据结构可能会发生变化。BCC作为BPF程序的编译工具链，必须能够理解这些变化并提供正确的编译环境。

在6.10及以上内核中，ARM架构的页处理机制发生了变化，引入了新的配置选项和头文件依赖。旧版BCC无法正确处理这些变化，导致编译时找不到必要的定义和头文件。

总结

Pixie项目在较新内核版本上的兼容性问题凸显了BPF技术栈的版本敏感性。通过升级BCC工具链，我们能够解决Socket Tracer在6.10及以上内核中的启动问题。这也提醒我们，在维护基于BPF的观测工具时，需要密切关注内核版本变化对工具链的影响，及时更新相关组件以保持兼容性。

对于用户而言，如果遇到类似问题，建议检查Pixie版本是否支持当前运行的内核版本，并及时升级到包含最新修复的版本。

登录后查看全文

项目优选

收起

deepin linux kernel

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

昇腾LLM分布式训练框架

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter