Async-profiler中Java 11+版本对象采样器的内存统计问题分析

2025-05-28 20:34:28作者：冯爽妲Honey

Sampling CPU and HEAP profiler for Java featuring AsyncGetCallTrace + perf_events

项目地址：https://gitcode.com/GitHub_Trending/as/async-profiler

问题背景

在Java性能分析工具Async-profiler的使用过程中，我们发现了一个关于对象分配采样(ObjectSampler)在Java 11及以上版本中的统计准确性问题。当使用--total模式进行内存分配分析时，工具显示的分配比例与实际分配情况存在明显偏差。

问题现象

通过一个简单的测试程序可以重现这个问题。该程序创建了两个线程分别执行不同大小的内存分配：

testSmallAlloc方法：每次分配1KB大小的字节数组，循环256次
testLargeAlloc方法：每次分配256KB大小的字节数组

从程序的实际输出日志可以看到，两种分配方式的总分配量基本相当：

small total: 2059834368
large total: 2060451840

然而，当使用Async-profiler的--total模式进行分析时，火焰图显示的比例却严重失真：

testLargeAlloc占99.91%
testSmallAlloc仅占0.81%

问题根源分析

经过深入代码分析，发现问题出在ObjectSampler::recordAllocation方法的实现上。在Java 11及以上版本中，当使用JVMTI的JVMTI_EVENT_SAMPLED_OBJECT_ALLOC事件进行对象采样时，代码错误地将分配间隔(interval)而非实际分配大小作为计数器(counter)值。

具体来说，在采样模式下，JVMTI不会对每次分配都触发事件，而是按照一定间隔进行采样。当前的实现中，代码将这次采样的对象大小作为计数器值，而没有考虑采样间隔带来的放大效应。这导致大对象分配的统计值被过度放大，而小对象分配的统计值则被严重低估。

解决方案

正确的做法应该是使用event._total_size作为计数器值。这个值反映了实际的分配总量，考虑了采样间隔的因素。经过修改后，火焰图显示的比例与实际分配情况相符，testSmallAlloc和testLargeAlloc的占比接近1:1，与程序的实际行为一致。

技术细节

在Java 11+中，Async-profiler使用JVMTI的采样分配事件来监控对象分配。关键点在于：

JVMTI_EVENT_SAMPLED_OBJECT_ALLOC事件提供了采样间隔信息
每次采样事件代表了一定数量的实际分配
当前实现错误地只记录了采样点的对象大小，而没有考虑采样代表的实际分配量

正确的统计方法应该将采样事件视为代表了一定数量的分配，因此计数器值应该是采样间隔乘以对象大小，即event._total_size。

影响范围

这个问题主要影响：

Java 11及以上版本
使用--alloc参数进行内存分配分析时
特别是使用--total模式查看分配总量时

对于Java 8及以下版本，由于使用不同的监控机制，不存在此问题。

总结

这个问题的修复使得Async-profiler在Java 11+环境下能够更准确地反映实际的内存分配情况，特别是在分析不同大小对象分配比例时。对于性能分析工具来说，数据的准确性至关重要，这次修正确保了工具在各种分配模式下的统计可靠性。

对于Async-profiler用户来说，如果需要在Java 11+环境中分析内存分配模式，建议使用包含此修复的版本，以获得更准确的分析结果。

Sampling CPU and HEAP profiler for Java featuring AsyncGetCallTrace + perf_events

项目地址：https://gitcode.com/GitHub_Trending/as/async-profiler

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

ohos_react_native

React Native鸿蒙化仓库

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。