OpenJ9虚拟机中线程中断标志清除问题的分析与解决

2025-06-24 00:42:49作者：申梦珏Efrain

Eclipse OpenJ9: A Java Virtual Machine for OpenJDK that's optimized for small footprint, fast start-up, and high throughput. Builds on Eclipse OMR (https://github.com/eclipse/omr) and combines with the Extensions for OpenJDK for OpenJ9 repo.

项目地址：https://gitcode.com/gh_mirrors/op/openj9

问题背景

在OpenJ9虚拟机（JDK21版本）中，开发人员发现了一个关于线程中断处理的间歇性问题。当多个线程同时对一个等待状态的线程发起中断请求时，偶尔会出现线程中断标志未被正确清除的情况，导致后续的等待操作被意外中断。

问题现象

通过一个测试程序可以复现该问题。程序创建了一个"waiter"线程和两个"interrupter"线程。waiter线程首先进入等待状态，然后两个interrupter线程分别对其发起中断请求。在中断处理后，waiter线程会检查自己的中断状态并尝试清除中断标志，然后再次进入等待状态。

在正常情况下，第二次等待不应该被中断。但测试发现，大约每1000次运行中会出现10次左右的异常情况，程序错误地认为仍有中断信号存在，导致第二次等待被意外中断。

技术分析

线程中断机制

Java中的线程中断机制是一种协作式的中断方式。当一个线程被中断时，会设置两个标志位：

Java层面的中断标志（通过Thread.interrupted()或isInterrupted()访问）
底层原生线程的中断标志（通过JVM内部实现）

正常情况下，调用Thread.interrupted()应该同时清除这两个标志位。

问题根源

通过分析发现，问题的根源在于OpenJ9虚拟机中处理线程中断时的同步问题。当多个线程几乎同时对一个目标线程发起中断请求时，可能会出现以下时序问题：

第一个中断请求到达，设置Java层和原生层的中断标志
第二个中断请求到达，再次设置原生层中断标志
目标线程调用Thread.interrupted()清除Java层标志
但由于竞争条件，原生层标志可能未被正确清除

这种竞态条件导致Java层和原生层的中断状态不一致，使得后续的等待操作错误地认为线程仍处于中断状态。

解决方案

OpenJ9开发团队通过以下方式解决了这个问题：

改进中断标志的原子性操作：确保Java层和原生层的中断标志修改是原子性的，避免两者状态不一致。
增强中断处理的同步机制：在设置和清除中断标志时增加适当的同步屏障，防止多线程并发修改导致的状态混乱。
完善中断状态的检查逻辑：在关键操作前增加额外的状态验证，确保中断标志被正确清除。

影响与验证

该修复确保了在多线程环境下中断处理的正确性，特别是对于以下场景：

多个线程同时中断同一个线程
线程在短时间内被反复中断
中断后立即进入等待状态的情况

开发团队通过大量压力测试验证了修复效果，确认问题不再复现。测试覆盖率包括：

单次中断场景
多次连续中断场景
高并发中断场景
中断后立即等待的场景

最佳实践

基于这个问题的解决经验，建议开发人员在使用线程中断时注意：

始终在捕获InterruptedException后检查并清除中断状态
避免依赖单一的中断状态检查，必要时进行二次验证
对于关键代码段，考虑增加额外的中断状态清理逻辑
在多线程环境中，特别注意中断操作的时序问题

这个问题的解决体现了OpenJ9团队对虚拟机可靠性的持续改进，也为Java多线程编程提供了有价值的实践经验。

openj9

项目地址：https://gitcode.com/gh_mirrors/op/openj9

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.03 K

492