OpenJ9 JIT编译器在处理System.Logger时触发崩溃的技术分析

2025-06-24 11:05:57作者：冯爽妲Honey

项目地址：https://gitcode.com/gh_mirrors/ope/openj9

概述

在OpenJ9项目中，开发者发现了一个与System.Logger相关的JIT编译器崩溃问题。该问题在使用OpenJDK 17和21版本时出现，而在OpenJDK 11或其他JVM实现(如标准JVM)中则不会发生。本文将深入分析这一问题的技术背景、产生原因以及解决方案。

问题现象

当运行一个包含System.Logger日志记录和递归方法调用的测试程序时，OpenJ9虚拟机在大约一分钟后会崩溃。崩溃时会产生核心转储文件，并伴随以下关键错误信息：

Assertion failed at omr/compiler/compile/OMRSymbolReferenceTable.cpp:1814
cannot create a pending push temporary that exceeds the number of slots for this method

技术背景

这个问题涉及到Java虚拟机的几个关键技术点：

JIT编译：即时编译器将字节码转换为本地机器代码以提高执行效率
invokedynamic指令：Java 7引入的动态调用机制，用于支持动态语言特性
栈帧管理：JVM维护方法调用的执行上下文
OSR(On-Stack Replacement)：在方法执行过程中替换已编译代码的技术

问题根源分析

经过深入调查，发现问题源于以下几个技术环节的交互：

递归调用导致的栈溢出：测试程序通过反射递归调用自身方法，最终导致栈溢出
invokedynamic解析异常处理：在解析字符串拼接的invokedynamic调用点时，未能正确处理栈溢出异常
方法签名不匹配：异常情况下返回的方法签名与实际需要的参数数量不符
操作数栈管理错误：JIT编译器在生成中间代码时，未能正确维护操作数栈状态

具体来说，当发生栈溢出时，MethodHandleResolver.resolveInvokeDynamic()捕获了所有Throwable但没有专门处理StackOverflowError。这导致返回了签名不正确的方法句柄，进而引发后续IL生成阶段的栈帧管理错误。

解决方案

修复方案主要包含以下关键点：

完善异常处理：在解析invokedynamic调用点时，需要特别处理栈溢出情况
签名验证：确保返回的方法句柄签名与实际参数要求匹配
操作数栈一致性检查：在IL生成阶段增加栈状态验证

技术影响

这个问题揭示了JIT编译器在处理极端情况(如递归导致的栈溢出)时可能存在的边界条件缺陷。特别是在以下方面需要特别注意：

动态调用与静态分析的交互：invokedynamic的动态特性与JIT的静态分析需要谨慎协调
异常处理完整性：所有可能的异常路径都需要考虑，包括虚拟机内部错误
栈帧一致性：在OSR等复杂场景下必须保证执行状态的正确性

结论

OpenJ9的这一案例展示了现代JVM实现中各种复杂特性的交互可能导致的边界条件问题。通过这个问题的分析，我们可以更好地理解JIT编译器内部的工作原理，以及在设计递归算法或使用反射机制时需要注意的潜在风险。对于JVM开发者而言，这也强调了全面异常处理和状态验证的重要性。

该问题的修复不仅解决了特定的崩溃场景，也增强了OpenJ9在复杂动态调用情况下的稳定性，为后续版本的功能完善奠定了基础。

openj9

项目地址：https://gitcode.com/gh_mirrors/ope/openj9

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解