async-profiler中LiveObject模式下的堆栈追踪问题解析

2025-05-28 20:14:27作者：温艾琴Wonderful

背景介绍

async-profiler是一款广泛使用的Java性能分析工具，它能够以极低的开销收集CPU、内存分配等性能数据。其中，LiveObject功能是该工具的一个重要特性，它允许开发者追踪和分析JVM堆内存中的存活对象。

问题现象

在使用async-profiler进行内存分析时，当启用LiveObject模式后，部分分配事件的堆栈追踪(StackTrace)会出现丢失现象。具体表现为：

解析生成的JFR文件时，某些分配事件的StackTrace字段为null
Java后端解析时抛出NullPointerException，因为无法获取到预期的堆栈信息
在IDEA等工具中查看JFR文件时，部分"Allocation in new TLAB"事件的StackTrace显示为空

问题根源分析

经过深入分析，发现问题的根本原因在于async-profiler当前的设计限制：

记录机制差异：在LiveObject模式下，记录分配事件时第二个参数被设置为0，而非实际分配大小
功能互斥：当前版本中，常规分配分析("jdk.ObjectAllocationInNewTLAB")与存活对象分析("profiler.LiveObject")不能同时正常工作
堆栈关联缺失：当只启用LiveObject模式时，部分分配事件未能正确关联到对应的调用堆栈

技术细节

在代码层面，问题主要出现在ObjectSampler类的recordAllocation方法中：

void ObjectSampler::recordAllocation(jvmtiEnv* jvmti, JNIEnv* jni, EventType event_type,
                                     jobject object, jclass object_klass, jlong size) {
    AllocEvent event;
    event._total_size = size > _interval ? size : _interval;
    event._instance_size = size;
    event._class_id = lookupClassId(jvmti, object_klass);

    if (_live) {
        u64 trace = Profiler::instance()->recordSample(NULL, 0, event_type, &event);
        live_refs.add(jni, object, size, trace);
    } else {
        Profiler::instance()->recordSample(NULL, event._total_size, event_type, &event);
    }
}