Kotlin协程库中CompletionStage.asDeferred()的栈溢出问题分析

2025-05-17 19:28:37作者：郦嵘贵Just

问题背景

在Kotlin协程库kotlinx.coroutines与Java并发API的交互中，存在一个潜在的性能陷阱：当对同一个CompletableFuture对象多次调用asDeferred()方法时，在特定条件下会导致栈溢出和回调丢失的问题。这个问题特别容易出现在异步缓存等高并发场景中。

问题现象

开发者发现，当满足以下条件时会出现异常行为：

对同一个CompletableFuture对象调用asDeferred()超过约1万次
该Future以异常方式完成
同时存在其他转换操作（如whenComplete）

此时会出现：

部分Deferred对象无法完成
附加的转换回调可能不会执行
可能伴随StackOverflowError（但通常被抑制）

技术原理分析

问题的根源在于CompletableFuture和协程Deferred之间的交互机制：

asDeferred()实现会为每个调用创建一个新的Deferred对象，并通过handle()方法注册回调
当Future完成时，会触发所有注册的回调
每个回调会完成对应的Deferred
Deferred完成时会尝试取消底层的Future（通过cancelFutureOnCompletion）
CompletableFuture.cancel()会递归触发后续回调的执行

这种递归调用模式在大量回调堆积时会导致调用栈深度增长，最终引发栈溢出。更严重的是，栈溢出可能导致部分回调无法正常执行，进而影响系统行为。

影响范围

这个问题特别容易出现在以下场景：

使用异步缓存（如Caffeine缓存）时
高并发环境下多个协程等待同一个Future结果
当底层操作失败时（异常完成）

在这些场景下，缓存可能返回同一个Future给大量请求者，当操作最终失败时就会触发此问题。

解决方案

临时解决方案

开发者可以暂时使用以下两种变通方法：

自定义safeAsDeferred()方法：

fun <T> CompletableFuture<T>.safeAsDeferred(): Deferred<T> {
    val safeFuture = object : CompletableFuture<T>() {
        override fun cancel(mayInterruptIfRunning: Boolean): Boolean {
            return if (!isDone) super.cancel(mayInterruptIfRunning) else isCancelled
        }
    }
    handle { result, exception ->
        if (exception == null) safeFuture.complete(result)
        else safeFuture.completeExceptionally(exception)
    }
    return safeFuture.asDeferred()
}