Elsa Core工作流引擎中的CorrelationId持久化问题解析

2025-05-31 21:12:14作者：贡沫苏Truman

问题背景

在Elsa Core工作流引擎中，CorrelationId是一个重要的设计概念，它用于将特定事件与等待该事件的工作流实例进行关联。然而，近期发现了一个关键性问题：当工作流使用书签队列(BookmarkQueue)机制时，CorrelationId未能被正确持久化，导致事件可能错误地触发不相关的工作流实例。

问题现象

当工作流引擎处理带有CorrelationId的事件时，如果目标工作流实例尚未创建(即没有现成的书签)，事件会被放入书签队列等待处理。此时出现以下异常情况：

队列中的事件丢失了CorrelationId信息
当队列中的事件被取出执行时，会忽略CorrelationId检查
导致事件可能触发完全不相关的工作流实例

技术原理分析

Elsa Core的工作流事件处理流程大致如下：

当事件到达时，引擎首先尝试查找匹配现有书签的工作流实例
如果找到匹配书签，立即恢复相应工作流
如果未找到匹配书签，将事件放入书签队列等待

问题出在第三步的队列处理环节。在StimulusSender.ResumeExistingWorkflowsAsync方法中，创建队列项时没有正确传递CorrelationId参数：

var bookmarkQueueItem = new NewBookmarkQueueItem
{
    WorkflowInstanceId = workflowInstanceId,
    BookmarkId = metadata?.BookmarkId,
    StimulusHash = stimulusHash,
    Options = new()
    {
        Input = input,
        Properties = properties
    }
    // 缺少CorrelationId赋值
};

影响范围

这个缺陷会导致以下业务场景出现问题：

需要精确事件路由的系统：如多租户系统，不同租户的工作流可能被错误触发
长时间运行的工作流：等待特定事件时可能被不相关事件意外唤醒
事件溯源系统：事件与工作流的关联关系被破坏

解决方案

修复方案相对直接，只需在创建队列项时正确传递CorrelationId：

var bookmarkQueueItem = new NewBookmarkQueueItem
{
    WorkflowInstanceId = workflowInstanceId,
    BookmarkId = metadata?.BookmarkId,
    StimulusHash = stimulusHash,
    CorrelationId = correlationId, // 添加此行
    Options = new()
    {
        Input = input,
        Properties = properties
    }
};