Async-profiler在采集性能数据时JVM崩溃问题深度解析

2025-05-28 13:52:12作者：盛欣凯Ernestine

Sampling CPU and HEAP profiler for Java featuring AsyncGetCallTrace + perf_events

项目地址：https://gitcode.com/GitHub_Trending/as/async-profiler

问题现象与背景

在使用Async-profiler 3.0版本进行性能数据采集时，部分用户遇到了JVM崩溃的情况。崩溃发生时，JVM正在执行FrameName::javaMethodName方法，错误表现为内存访问异常，寄存器状态显示存在未知值或无效内存引用。这种情况主要出现在OpenJDK 11环境中，操作系统为CentOS。

技术原理分析

根本原因

该问题本质上是一个JVM内部缺陷，与JVM TI（Tool Interface）接口的实现有关。当Async-profiler尝试通过jvmti_GetClassSignature获取类签名信息时，JVM在验证对象类型（oopDesc::is_a）的过程中发生了内存访问异常。这表明JVM在处理某些特殊条件下的类元数据时存在边界情况未处理完善。

触发条件

特定JDK版本：主要出现在OpenJDK 11的某些早期版本中
采样场景：在CPU性能分析（CPU profiling）时更容易触发
内存状态：当JVM内存中存在特定模式的类加载关系时

解决方案与应对措施

官方修复方案

该问题已被确认为JVM内部bug，并在后续的JDK更新中得到修复。建议用户：

升级到最新的JDK 11更新版本
或考虑升级到更高版本的JDK（如JDK 17+）

Async-profiler的临时解决方案

Async-profiler开发团队已在工具层面实现了防御性编程措施：

增加了对异常内存状态的检测
优化了方法名获取流程中的错误处理机制
实现了更安全的类元数据访问方式

扩展讨论：内存分配分析的影响

虽然该问题主要在CPU分析时出现，但从技术原理上看：

内存分配分析（Allocation profiling）理论上也可能触发类似问题
但实际案例中内存分析触发该问题的报告较少
这是因为内存分析涉及的类元数据访问模式与CPU分析有所不同

最佳实践建议

版本管理：
- 保持JDK和Async-profiler都更新到最新稳定版本
- 特别关注JDK 11.0.12+版本
监控策略：
- 在生产环境启用性能分析前，先在测试环境验证
- 考虑使用渐进式分析策略，先短时间采样验证稳定性
故障排查：
- 出现崩溃时保存完整的hs_err日志
- 可以尝试减小采样间隔或限制采样范围

技术启示

这个案例很好地展示了性能分析工具与JVM实现的深度交互关系。即使是成熟的工具链组合，在特定边界条件下仍可能出现问题。这提醒我们：

性能分析工具的使用需要考虑JVM实现的细节
生产环境中的性能监控需要建立完善的回滚机制
开源生态中及时反馈问题有助于快速修复

Sampling CPU and HEAP profiler for Java featuring AsyncGetCallTrace + perf_events

项目地址：https://gitcode.com/GitHub_Trending/as/async-profiler

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力