Helidon并发限制模块中AIMD实现的内存泄漏问题分析

2025-06-20 17:46:02作者：裴锟轩Denise

问题背景

在Helidon 4.1.x版本中，其并发限制模块(Concurrency Limit)引入了一个新的AIMD(Additive Increase/Multiplicative Decrease)算法实现。该算法本应提供动态调整并发请求限制的能力，但在实际使用中却出现了严重问题：当并发请求数达到初始限制后，系统会持续返回503错误，无法处理后续请求。

问题现象

开发团队在使用Helidon构建的Spectra UCP示例中进行测试时，配置了以下AIMD参数：

最小限制(min-limit): 5
最大限制(max-limit): 10
初始限制(initial-limit): 5
超时时间(timeout): 2秒
回退比率(backoff-ratio): 0.8

当仅使用5个并发用户测试时，系统就开始出现503服务不可用错误。这表明并发限制机制没有按预期工作，请求无法被正确处理。

根本原因分析

通过深入代码分析，发现问题出在AimdLimitImpl类的实现上。该类使用Semaphore来控制并发请求数量，但在以下关键环节存在缺陷：

信号量获取与释放不匹配：tryAcquire()方法成功获取信号量后，没有在请求处理完成后正确释放信号量
Token实现不完整：AimdToken虽然实现了dropped()、ignore()和success()方法，但这些方法都没有调用semaphore.release()
并发计数器管理混乱：currentRequests和concurrentRequests两个计数器之间的关系不清晰

这种设计缺陷导致一旦初始的5个信号量被获取，系统就无法再处理新请求，因为信号量永远不会被释放。

解决方案

开发团队提出了以下修复方案：

修改AimdToken构造函数：将Semaphore实例传递给Token对象
完善Token生命周期方法：在所有结束方法(dropped/ignore/success)中都添加semaphore.release()
优化计数器管理：确保并发计数器与信号量状态同步

修改后的关键代码如下：

private final Semaphore semaphore;

private AimdToken(Supplier<Long> clock, AtomicInteger concurrentRequests,Semaphore semaphore) {
    startTime = clock.get();
    currentRequests = concurrentRequests.incrementAndGet();
    this.semaphore = semaphore;
}

@Override
public void dropped() {
    semaphore.release();
    updateWithSample(startTime, clock.get(), currentRequests, false);
}

@Override
public void ignore() {
    concurrentRequests.decrementAndGet();
    semaphore.release();
}

@Override
public void success() {
    concurrentRequests.decrementAndGet();
    semaphore.release();
    updateWithSample(startTime, clock.get(), currentRequests, true);
}