Apache Log4j2性能回归问题分析与修复：异常堆栈渲染优化

2025-06-24 15:03:47作者：俞予舒Fleming

在Apache Log4j2从2.24.1版本升级到2.25.0-SNAPSHOT的过程中，开发团队发现了一个严重的性能退化问题——异常堆栈渲染性能下降了约60%。这个问题引起了核心团队的重视，并最终定位到ThrowablePatternConverter的实现上。

问题背景

异常日志是日志系统中常见的功能需求，但2.25.0-SNAPSHOT版本在处理异常堆栈时出现了明显的性能下降。经过基准测试对比，新版本不仅执行速度变慢，还产生了大量不必要的对象分配。

性能分析

通过详细的性能剖析，团队发现问题的根源在于ThrowableExtendedStackTraceRenderer.createClassResourceInfoByName()方法。这个方法在新版本中做了以下高成本操作：

为每个堆栈帧创建ClassResourceInfo对象
在每个ClassResourceInfo构造过程中使用了String.format()方法
创建了HashSet和ArrayDeque等临时集合

这些操作导致了大量的对象分配和字符串格式化开销，特别是在频繁记录异常的场景下，这些开销会被显著放大。

技术细节

在2.24.1版本中，ExtendedThrowablePatternConverter采用了更高效的实现方式，几乎不产生额外对象分配。而2.25.0版本的ThrowablePatternConverter为了提供更丰富的异常信息（如模块/包信息），引入了这些高开销操作。

特别值得注意的是String.format()的使用——这个方法虽然方便，但在性能敏感的场景下代价很高。当需要处理大量堆栈帧时，这些微小开销会被累积放大。

解决方案

开发团队通过以下优化措施解决了这个问题：

移除了不必要的String.format()调用，改用更高效的字符串拼接方式
优化了ClassResourceInfo的创建逻辑，减少对象分配
简化了集合操作，降低内存开销

这些优化显著降低了异常渲染路径上的CPU和内存开销，使性能恢复到2.24.1版本的水平。

经验总结

这个案例为日志系统开发提供了宝贵经验：

性能敏感路径上的便利方法（如String.format）需要谨慎使用
新功能的引入必须进行充分的性能评估
对象分配在频繁执行的代码路径上会产生累积效应
基准测试应该成为发布流程的必需环节

对于使用Log4j2的开发人员，如果遇到异常日志性能问题，可以考虑：

评估是否真的需要完整的异常堆栈信息
在高频日志场景下考虑使用简化版异常格式
定期更新到最新稳定版本以获取性能改进

这个问题的及时修复确保了Log4j2 2.25.0正式版的发布质量，维护了其作为高性能日志框架的声誉。

logging-log4j2

Apache Log4j is a versatile, feature-rich, efficient logging API and backend for Java.

项目地址：https://gitcode.com/gh_mirrors/log/logging-log4j2

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

395

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.68 K

989