Workflow框架中客户端断开连接时的资源清理问题解析

2025-05-16 05:39:10作者：范靓好Udolf

背景介绍

在基于Workflow框架开发服务端推送功能时，开发者经常会遇到一个典型问题：当客户端主动断开连接时，服务端尚未执行完成的任务（如定时任务、条件任务等）可能会持续占用系统资源，导致资源泄漏。本文将深入分析这一问题的成因，并提供几种可行的解决方案。

问题本质

Workflow框架中的任务执行机制基于series（任务序列）的概念。当一个客户端连接建立后，服务端通常会创建一个series来处理该连接的所有相关任务。问题出现在以下场景：

服务端在process函数中创建了WFConditional任务等待特定信号
客户端在条件任务等待期间主动断开连接
由于条件任务尚未收到信号，series的callback不会被立即触发
服务端资源（如消息订阅等）无法及时释放

技术细节分析

任务取消机制的特性

Workflow框架中的series cancel操作具有以下特点：

只能取消尚未开始执行的任务
对于已经dispatch但正在等待的条件任务(WFConditional)，cancel操作无法立即终止
series的callback无论是否cancel都会被调用，但必须等待所有任务完成

连接生命周期管理

Workflow中连接的生命周期与任务执行是解耦的：

连接可以设置context和deleter回调
连接关闭时会触发deleter
但连接状态变化不会自动影响正在执行的任务

解决方案

方案一：连接关闭时主动触发信号

在连接关闭的deleter中，除了cancel series外，还需要手动触发条件任务的信号：

auto deleter = [](void* context) {
    log_info("connection closed");
    if (context) {
        SeriesWork* series = (SeriesWork*)context;
        series->cancel();
        // 手动触发条件任务的信号
        WFMyConditional::signal("topic_name"); 
    }
};

方案二：使用命名组件

对于定时器、计数器等组件，建议使用命名版本：

命名组件可以全局访问和控制
连接关闭时可以精确找到并取消相关组件
避免了匿名组件难以追踪的问题

方案三：双重检查机制

结合连接状态检查和任务取消：

在process中设置连接context和deleter
在server task的callback中清除连接context
在条件任务的callback中检查连接状态

void process(WFHttpTask* server_task) {
    SeriesWork* series = series_of(server_task);
    server_task->get_connection()->set_context(series, [](void* ctx) {
        if (ctx) ((SeriesWork*)ctx)->cancel();
    });
    
    WFConditional* cond = WFConditional::create(...);
    cond->start([server_task](WFConditional* cond) {
        if (!server_task->get_connection()) {
            // 连接已断开，不再处理
            return;
        }
        // 正常处理逻辑
    });
}