Swoole HTTP 服务器中异步请求的死锁问题与解决方案

2025-05-12 18:10:18作者：董宙帆

问题背景

在使用Swoole构建异步HTTP服务器时，开发者可能会遇到一个特殊的死锁问题。当服务器配置了多个worker进程，并且存在相互依赖的HTTP请求时，可能会出现请求被无限阻塞的情况。

具体场景表现为：

服务器配置了2个worker进程
客户端请求/version接口
在处理/version请求时，服务器内部又发起对/health接口的请求
当并发请求达到一定数量时，所有worker进程会被阻塞长达60秒（取决于内部请求的超时设置）

问题根源分析

这个问题的本质是worker进程间的资源竞争和调度策略导致的死锁。Swoole默认的请求分发机制是：

当有新请求到达时，优先分配给空闲的worker进程
如果没有空闲worker，则随机选择一个worker，请求会被放入该worker的队列中等待处理

在这种机制下，可能会出现以下死锁场景：

Worker A正在处理/version请求，并向/health接口发起内部请求
Worker B被分配处理这个内部/health请求
此时又来了新的/version请求，由于没有空闲worker，被随机分配到Worker B
Worker B完成/health请求后，开始处理新的/version请求
在处理这个/version请求时，又需要发起/health请求
由于没有空闲worker，这个/health请求可能再次被分配到Worker B
结果Worker B被自己的请求阻塞，形成死锁

解决方案

1. 使用协程模式

最彻底的解决方案是启用Swoole的协程功能。协程可以避免阻塞式IO操作，从根本上解决死锁问题：

$http->set([
    'worker_num' => 2,
    'enable_coroutine' => true,
    'hook_flags' => SWOOLE_HOOK_ALL
]);

使用协程后，内部HTTP请求不会阻塞worker进程，其他请求可以继续被处理。

2. 自定义请求分发策略

如果无法使用协程，可以通过自定义dispatch_func来指定特定worker处理特定请求：

$http->set([
    'worker_num' => 4,
    'dispatch_func' => function ($server, $fd, $type, $data) {
        if ($data && str_starts_with($data, 'GET /health HTTP/1.1')) {
            return 3; // 指定最后一个worker处理health请求
        }
        return rand(0, 2); // 其他worker处理普通请求
    }
]);

这种方案将健康检查请求和普通请求分开处理，避免相互阻塞。

3. 使用Task Worker处理内部请求

另一种思路是将内部请求的处理转移到task worker中：

$http->set([
    'worker_num' => 4,
    'task_worker_num' => 4
]);

$http->on('request', function ($request, $response) use ($http) {
    $http->task('health'); // 将健康检查交给task worker
    $response->end('Hello World');
});

$http->on('task', function ($serv, $task_id, $reactor_id, $data) {
    // 处理健康检查逻辑
});