OpenJ9虚拟机中虚拟线程堆栈跟踪问题的分析与解决

2025-06-24 07:34:44作者：凌朦慧Richard

Eclipse OpenJ9: A Java Virtual Machine for OpenJDK that's optimized for small footprint, fast start-up, and high throughput. Builds on Eclipse OMR (https://github.com/eclipse/omr) and combines with the Extensions for OpenJDK for OpenJ9 repo.

项目地址：https://gitcode.com/gh_mirrors/op/openj9

问题背景

在OpenJ9虚拟机21.0.7-beta版本中，开发团队发现了一个与服务性(serviceability)相关的JVM TI测试用例失败的问题。具体表现为在虚拟线程(virtual thread)场景下获取挂起线程的堆栈跟踪(StackTrace)时，输出的堆栈信息不符合预期格式。

问题现象

测试用例GetStackTraceSuspendedStressTest.java在执行过程中报告了"incorrect stacktrace"错误。测试期望虚拟线程的堆栈跟踪应该从特定的入口方法开始，但实际获取到的堆栈跟踪却显示了不同的起始点。

从错误日志中可以看到，测试期望堆栈跟踪应该从"enter(...)"方法开始，但实际获取到的堆栈跟踪起始于java/util/concurrent/SynchronousQueue$Transferer.xferLifo方法，随后经过一系列方法调用，最终到达虚拟线程的底层实现。

技术分析

这个问题涉及到OpenJ9虚拟机对Java虚拟线程(JEP 425)的支持实现。虚拟线程是Java 19引入的轻量级线程，由JVM管理而非操作系统管理。在获取虚拟线程的堆栈跟踪时，JVM需要正确处理虚拟线程特有的调用栈结构。

从技术实现角度看，这个问题可能源于：

虚拟线程挂起状态下的堆栈帧捕获逻辑不完善
JVM TI接口在处理虚拟线程时的特殊路径未正确实现
堆栈跟踪起始点判断逻辑需要调整

解决方案

开发团队通过分析确定了问题根源，并提交了修复代码。主要修正点包括：

完善了虚拟线程挂起状态下的堆栈帧捕获逻辑
调整了JVM TI接口对虚拟线程的特殊处理路径
确保堆栈跟踪能够正确反映虚拟线程的执行路径

修复后，测试用例能够正确获取虚拟线程在挂起状态下的完整堆栈跟踪，且起始点符合预期。

影响范围

该问题主要影响：

使用JVM TI接口获取虚拟线程堆栈跟踪的应用
依赖堆栈跟踪正确性的调试工具和监控系统
使用虚拟线程进行复杂并发编程的场景

总结

OpenJ9团队通过这个问题进一步优化了对Java虚拟线程的支持，特别是在服务性方面的实现。这不仅解决了当前测试失败的问题，也为后续虚拟线程相关功能的稳定性奠定了基础。对于使用OpenJ9运行时的开发者来说，这一修复意味着在使用虚拟线程时可以获得更准确的调试信息，有助于复杂并发问题的诊断和解决。

openj9

项目地址：https://gitcode.com/gh_mirrors/op/openj9

登录后查看全文

项目优选

收起

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

461

5.45 K

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.1 K

1.15 K