OpenJ9 GC策略中Balanced模式的内存分配优化分析

2025-06-24 03:58:16作者：俞予舒Fleming

项目地址：https://gitcode.com/gh_mirrors/ope/openj9

背景概述

在Java虚拟机实现中，内存管理是一个核心组件。OpenJ9作为高性能的JVM实现，提供了多种垃圾回收策略，其中Balanced模式是一种针对大内存系统优化的GC策略。然而，在实际使用中发现，Balanced模式在初始化阶段会创建过多的copy-cache结构，导致内存占用过高和启动延迟问题。

问题现象

当使用Balanced GC策略(-Xgcpolicy:balanced)配合大堆内存配置(-Xmx12T)时，观察到以下现象：

初始化阶段创建了约15GB的copy-cache结构
启动时间显著延长，达到秒级延迟
在16GB物理内存的测试机上，无法启动更大的堆配置

相比之下，传统的Gencon策略(-Xgcpolicy:gencon)在72TB堆配置下仅需约3GB的初始内存提交，表现更为优秀。

技术分析

Copy-Cache的作用

在Balanced GC策略中，copy-cache是用于并行垃圾回收的关键数据结构。它作为工作缓冲区，存储待处理的对象引用，帮助GC线程高效地进行对象复制和扫描操作。

性能瓶颈

通过CPU性能分析，可以观察到以下热点：

内核空间的页面清除操作(clear_page_erms)占用了24.84%的时间
CopyScanCacheChunkVLHGC的初始化占用了19.56%的时间
用户地址错误处理(do_user_addr_fault)占用了18.18%的时间

这表明内存分配和初始化是主要的性能瓶颈。

内存分配机制

Balanced模式在初始化阶段会预分配大量copy-cache结构，这些结构无论是否使用都会占用物理内存或虚拟地址空间。这种设计虽然可以提高后续GC操作的效率，但带来了两个问题：

启动时的内存压力过大
初始化时间过长

解决方案

通过优化copy-cache的分配策略，实现了以下改进：

延迟分配：改为按需分配copy-cache，而不是在初始化阶段全部预分配
动态调整：根据实际工作负载动态调整copy-cache的数量
内存回收：在非GC阶段释放部分闲置的copy-cache

优化效果

经过优化后，Balanced模式的内存占用显著降低：

初始内存提交量大幅减少
大堆配置下的启动时间缩短
可以在有限物理内存的机器上支持更大的堆配置

技术启示

这个优化案例展示了GC策略设计中需要考虑的几个重要因素：

启动性能与运行时性能的平衡
内存占用的控制策略
数据结构分配时机的选择

对于大内存系统，延迟初始化和按需分配往往是更优的选择，这可以显著改善系统的响应性和资源利用率。

openj9

项目地址：https://gitcode.com/gh_mirrors/ope/openj9

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。