async-profiler中DebugNonSafepoints对CodeCache内存的影响分析

2025-05-28 00:49:49作者：尤峻淳Whitney

在Java性能分析工具async-profiler的使用过程中，开发者发现通过-agentpath参数加载时会显著增加JVM的CodeCache内存占用。本文将深入剖析这一现象的技术原理、影响机制以及解决方案。

现象描述

当使用async-profiler 3.0版本配合Corretto OpenJDK 21.0.2.14.1时，通过-agentpath参数启动JVM会观察到：

CodeCache中的profiled和non-profiled nmethods内存区域明显增长
内存增长幅度可达30-40MB（从86MB增至116MB）
内存利用率更快达到上限（100% vs 80%）

根本原因

async-profiler在加载时会自动启用-XX:+DebugNonSafepointsJVM参数。这个参数会强制JIT编译器为编译后的方法生成额外的调试信息，包括：

精确的方法内联记录
详细的栈帧映射信息
字节码位置映射表

这些额外信息虽然提升了性能分析数据的准确性，但同时也显著增加了每个编译方法的体积，导致CodeCache内存消耗增加。

影响机制

CodeCache内存分为三个主要区域：

非分析方法区：存储普通编译方法
分析方法区：存储带性能分析信息的编译方法
非方法区：存储其他JVM内部代码

DebugNonSafepoints主要影响前两个区域：

每个编译方法需要额外存储调试信息
方法内联记录需要更多空间
栈帧映射表体积增大

解决方案

方案一：增加CodeCache容量

通过JVM参数调整CodeCache大小：

-XX:ReservedCodeCacheSize=512M
-XX:InitialCodeCacheSize=256M

方案二：禁用自动DebugNonSafepoints

在JVM启动参数中显式指定：

-XX:-DebugNonSafepoints

注意：这会降低栈轨迹的精确度，特别是最顶层内联帧的映射准确性。

方案三：延迟加载profiler

避免在启动时通过-agentpath加载，改为在需要时通过asprof命令附加，可以减少早期编译方法的影响。

最佳实践建议

对于长期运行的生产环境，建议：
- 预先评估CodeCache需求
- 适当增加CodeCache容量
- 考虑延迟加载profiler
对于需要高精度分析的场景：
- 接受更高的内存开销
- 确保系统有足够的内存余量
对于内存敏感环境：
- 使用-XX:-DebugNonSafepoints
- 了解可能的分析精度损失

技术展望

未来JVM可能会将这一机制整合到JFR（JDK Flight Recorder）中，实现更统一的分析数据收集方式。开发者应关注相关JEP的演进动态。

通过理解这些底层机制，开发者可以更合理地使用async-profiler，在分析精度和系统资源消耗之间取得最佳平衡。

async-profiler

Sampling CPU and HEAP profiler for Java featuring AsyncGetCallTrace + perf_events

项目地址：https://gitcode.com/GitHub_Trending/as/async-profiler

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。