Async-profiler静态初始化顺序问题分析与修复

2025-05-28 15:46:18作者：袁立春Spencer

Sampling CPU and HEAP profiler for Java featuring AsyncGetCallTrace + perf_events

项目地址：https://gitcode.com/GitHub_Trending/as/async-profiler

问题背景

在Async-profiler项目中，当使用MERGE=false编译选项时，某些环境下会出现程序崩溃的问题。这个问题发生在JVM启动阶段加载async-profiler作为agent时，具体表现为在Symbols::parseLibraries函数执行过程中发生段错误(SIGSEGV)。

技术分析

通过调用栈分析，崩溃发生在parseLibrariesCallback函数试图向一个静态集合_parsed_libraries插入元素时。这个集合是一个std::set<void const*>类型的静态变量，定义在symbols_linux.cpp文件中。

根本原因在于静态变量的初始化顺序问题。Async-profiler使用了一个名为LateInitializer的机制，意图确保某些初始化操作在所有其他静态变量初始化完成后执行。然而，C++标准并不保证不同编译单元中静态变量的初始化顺序，这导致了在某些编译器版本(如GCC 7.3.1)下，LateInitializer可能在其他静态变量完全初始化前就被执行。

解决方案

修复方案主要涉及以下几个方面：

延迟初始化模式：将关键静态变量改为首次使用时初始化的模式，避免依赖静态初始化顺序。
线程安全初始化：对于需要在多线程环境下访问的静态资源，使用适当的同步机制确保线程安全。
简化初始化逻辑：重构代码结构，减少对复杂静态初始化顺序的依赖。

技术细节

在修复中，特别需要注意以下几点：

静态集合_parsed_libraries的访问需要保证线程安全
符号解析相关的初始化操作需要确保在JVM完全启动后执行
避免在静态初始化阶段进行可能失败或依赖其他模块的操作

影响范围

该问题主要影响以下环境：

使用GCC 7.x及以下版本编译
以agent模式在JVM启动时加载async-profiler
使用MERGE=false编译选项构建的版本

最佳实践

对于类似静态初始化顺序问题，建议：

尽量减少对静态变量的使用，特别是跨编译单元的依赖
对于必须的静态资源，采用"首次使用时初始化"模式
在关键路径上添加必要的运行时检查
针对不同编译器和平台进行充分测试

总结

静态初始化顺序问题是C/C++项目中常见的陷阱之一。Async-profiler通过这次修复，不仅解决了特定环境下的崩溃问题，也为项目的长期稳定性打下了更好的基础。对于开发者而言，理解静态初始化的复杂性和平台差异性，是编写可靠跨平台代码的重要一课。

Sampling CPU and HEAP profiler for Java featuring AsyncGetCallTrace + perf_events

项目地址：https://gitcode.com/GitHub_Trending/as/async-profiler

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。