Apache Log4j2 并发死锁问题分析与解决方案

2025-06-24 02:17:50作者：俞予舒Fleming

在 SpringBoot 3.x 应用中使用 ActiveMQ Artemis 和 Log4j2 时，可能会遇到一个棘手的并发问题。这个问题表现为两种不同的症状：当启用 SpringBoot 的 backend-preinit 功能时会出现死锁，而禁用该功能时则会导致栈溢出。本文将深入分析这个问题的根源，并介绍有效的解决方案。

问题现象

开发者在使用 SpringBoot 3.x 应用时，结合 ActiveMQ Artemis 2.38 和 Log4j 2.24.2 时发现了这个问题。主要表现有两种：

当启用 backend-preinit 时，应用启动时会陷入死锁状态
当禁用 backend-preinit 时，应用启动时会出现栈溢出错误

从线程转储中可以清楚地看到，死锁发生在 Log4j2 的 InternalLoggerRegistry.getLogger() 方法中，涉及 ReentrantReadWriteLock 的获取。

根本原因分析

经过深入分析，发现这是一个真实的死锁问题，其根源在于 Log4j2 的 PropertiesUtil.getStringProperty() 方法和 Spring 的 JndiPropertySource.getProperty() 方法之间的递归调用。具体流程如下：

JndiPropertySource.getProperty() 方法初始化 Artemis
Artemis 锁定了 BeanUtilsBean
Log4j2 在锁定 InternalLoggerRegistry 后调用 new Logger()
Log4j2 在所有可用的属性源中查找 log4j2.flowMessageFactory 属性
这个过程又回到了第一步

这种循环调用模式完美解释了为什么会出现死锁和栈溢出两种不同的症状。

技术细节

问题的核心在于 Log4j2 的 InternalLoggerRegistry 使用了弱引用和 computeIfAbsent() 方法。当已注册的记录器在初始化过程中被作为弱引用释放时，可能会导致重复初始化，从而引发并发问题。

在栈溢出的情况下，调用链显示从 JNDI 初始化到属性解析的无限递归，最终耗尽栈空间。而在死锁情况下，多个线程相互等待对方持有的锁资源，导致系统停滞。

解决方案

Apache Log4j2 团队已经针对这个问题提出了修复方案，并发布了 2.24.3-SNAPSHOT 版本。开发者可以通过以下方式解决这个问题：

升级到 Log4j2 2.24.3 或更高版本
临时解决方案：
- 通过设置 spring.jndi.ignore 为 true 强制禁用 JndiPropertySource
- 如果不在 Servlet 环境中运行，可以移除 java.naming.* 系统属性

最佳实践

为了避免类似问题，建议开发者：

保持日志框架和中间件的最新版本
在复杂的应用环境中，仔细检查各组件之间的依赖关系
对于关键业务系统，进行充分的并发测试
监控应用启动过程中的线程状态，及时发现潜在的并发问题

结论

这个案例展示了在现代Java应用中，框架之间的交互可能导致的复杂并发问题。通过深入分析调用链和锁定顺序，开发团队能够准确定位问题根源并提供有效解决方案。这也提醒我们在集成多个成熟框架时需要格外注意它们之间的交互方式。

对于遇到类似问题的开发者，建议及时升级到修复版本，或者采用推荐的临时解决方案，确保应用的稳定运行。

logging-log4j2

Apache Log4j is a versatile, feature-rich, efficient logging API and backend for Java.

项目地址：https://gitcode.com/gh_mirrors/log/logging-log4j2

登录后查看全文