Apache Seata 项目中DataSourceProxy重复创建导致OOM问题分析

2025-05-07 14:12:43作者：羿妍玫Ivan

问题背景

在Apache Seata分布式事务框架的使用过程中，开发者遇到了一个典型的内存溢出问题。当系统并发量上升时，线程数量持续增长且无法释放，最终导致java.lang.OutOfMemoryError: unable to create native thread错误。这个问题特别出现在从Seata 1.5.2版本升级到1.7.0版本后。

问题现象

异常堆栈显示，OOM错误发生在创建新线程时，具体是在TableMetaCacheFactory$TableMetaRefreshHolder初始化过程中。深入分析发现，这是由于在每次获取数据库连接时都创建了新的DataSourceProxy实例，而没有进行合理的缓存和资源管理。

根本原因分析

DataSourceProxy创建机制：在Seata 1.7.0版本中，每次创建新的DataSourceProxy实例时，都会初始化一个TableMetaRefreshHolder，这会创建一个线程池用于表元数据刷新。
不当的使用模式：在APIJSON框架的扩展实现中，getConnection方法在每次需要新连接时都会执行new DataSourceProxy(dataSource).getConnection()，而没有重用已创建的DataSourceProxy实例。
资源泄漏：随着并发请求增加，不断创建新的DataSourceProxy实例，每个实例都会创建自己的线程池，最终耗尽系统资源。

技术细节

在Seata的实现中，DataSourceProxy的初始化过程包含以下关键步骤：

调用init()方法注册表元数据
通过TableMetaCacheFactory.registerTableMeta()创建元数据缓存
初始化TableMetaRefreshHolder，这会创建一个单线程的ScheduledExecutorService

当频繁创建DataSourceProxy实例时，每个实例都会创建自己的定时任务线程，这是导致线程数暴增的直接原因。

解决方案

正确的做法应该是：

缓存DataSourceProxy实例：将DataSourceProxy与底层DataSource一起缓存，而不是每次创建新实例。
连接池管理：确保数据库连接的正确关闭和回收，避免连接泄漏。
单例模式：对于同一个数据源URL，应该只创建一个DataSourceProxy实例。

示例改进代码结构：

// 在类初始化时创建缓存
private static final Map<String, DataSourceProxy> proxyCache = new ConcurrentHashMap<>();

public Connection getConnection(SQLConfig config) throws Exception {
    String dbUri = config.getDBUri();
    if (StringUtils.isNotBlank(dbUri)) {
        DataSourceProxy proxy = proxyCache.computeIfAbsent(dbUri, 
            k -> new DataSourceProxy(getOrCreateDataSource(config)));
        return proxy.getConnection();
    }
    // 其他逻辑...
}