OpenJ9项目中DoubleToDecimalTest超时问题的技术分析与解决方案

2025-06-24 16:02:58作者：庞队千Virginia

Eclipse OpenJ9: A Java Virtual Machine for OpenJDK that's optimized for small footprint, fast start-up, and high throughput. Builds on Eclipse OMR (https://github.com/eclipse/omr) and combines with the Extensions for OpenJDK for OpenJ9 repo.

项目地址：https://gitcode.com/gh_mirrors/op/openj9

问题背景

在OpenJ9项目的测试过程中，发现jdk_lang_j9测试组中的DoubleToDecimalTest测试用例在多平台（包括aarch64和x86架构的Linux/Mac系统）上频繁出现超时问题。该问题主要在使用balanced GC策略时出现，表现为测试执行时间远超预期（从正常的约65秒延长到16分钟以上），最终因超时而被终止。

问题现象

测试用例在执行过程中会卡在jdk.internal.math.FloatingDecimal.parseDouble()方法中，具体是在处理特定双精度浮点数值（如"9.999999999999E82"）时进入无限循环。从多个失败的测试日志中可以观察到一致的调用栈模式，都指向了FloatingDecimal类中的相同代码路径。

技术分析

根本原因

经过深入分析，发现问题根源在于JIT编译器对FDBigInteger.mult()方法的优化存在缺陷。该方法包含一个嵌套循环结构，用于执行大整数乘法运算：

private static void mult(int[] s1, int s1Len, int[] s2, int s2Len, int[] dst) {
    for (int i = 0; i < s1Len; i++) {    // 外层循环
        long v = s1[i] & LONG_MASK;
        long p = 0L;
        for (int j = 0; j < s2Len; j++) {    // 内层循环
            p += (dst[i + j] & LONG_MASK) + v * (s2[j] & LONG_MASK);
            dst[i + j] = (int) p;
            p >>>= 32;
        }
        dst[i + s2Len] = (int) p;
    }
}

在Scorching优化级别下，JIT编译器对循环进行了LoopStrider变换，尝试将数组地址计算（dst[i + s2Len]）提升到循环外。然而，这个优化错误地忽略了s2Len的加法操作（在本例中s2Len为24），导致最终计算出的数组地址不正确。

问题表现

当这个错误的优化被应用后，会导致以下后果：

数组访问位置计算错误，可能访问到错误的数组元素
在Double.parseDouble()调用链中，错误的数据会导致算法无法收敛
最终表现为无限循环，测试用例无法完成

相关背景

FDBigInteger是Java内部用于处理浮点数到十进制字符串转换的辅助类，它实现了大整数运算以保持精度。DoubleToDecimalTest测试用例则验证了这些转换在各种边界条件下的正确性。当底层的大整数运算出现问题时，会导致转换算法无法正确终止。

解决方案

针对这个问题，开发团队提出了以下解决方案：

修正LoopStrider变换中的数组地址计算逻辑，确保s2Len的加法操作被正确保留
加强对内部指针临时变量的管理，避免在GC安全点保留不安全的内部指针
增加对类似优化模式的验证机制，防止类似错误再次发生

影响范围

该问题主要影响：

使用balanced GC策略的环境
aarch64和x86架构的Linux/Mac系统
涉及浮点数到字符串精确转换的场景

经验总结

这个案例提供了几个重要的经验教训：

JIT优化虽然能提升性能，但也可能引入微妙的正确性问题
循环优化特别是涉及数组访问时需要格外小心地址计算
测试用例的超时可能是更深层次正确性问题的表现
复杂的数学运算实现需要特别关注边界条件和算法收敛性

通过这个问题的分析和解决，OpenJ9项目在JIT优化和浮点数处理方面又向前迈进了一步，提高了运行时环境的稳定性和可靠性。

Eclipse OpenJ9: A Java Virtual Machine for OpenJDK that's optimized for small footprint, fast start-up, and high throughput. Builds on Eclipse OMR (https://github.com/eclipse/omr) and combines with the Extensions for OpenJDK for OpenJ9 repo.

项目地址：https://gitcode.com/gh_mirrors/op/openj9

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理