Novu框架中跳过步骤导致后续步骤执行失败的问题分析

2025-05-03 10:09:18作者：邵娇湘

问题背景

在使用Novu工作流框架时，开发人员发现当工作流中的某个步骤被跳过(skip)后，后续步骤的执行会出现异常。这个问题不仅出现在inApp类型的步骤中，也出现在自定义(custom)步骤中。

问题现象

具体表现为：当一个步骤被配置了skip条件并且条件满足时，框架会尝试验证该步骤的输出结果，但由于步骤实际上被跳过了，没有产生有效的输出数据，导致验证失败。错误信息会提示"Workflow has an invalid state"和"must have required property"等验证错误。

技术分析

问题的根本原因在于框架的执行逻辑存在缺陷。在executeStepFactory函数中，skip检查只在实际执行步骤时进行，而在步骤状态恢复(hydration)时没有进行相应的处理。这导致框架在恢复工作流状态时，会错误地尝试验证被跳过步骤的输出结果。

对于自定义步骤(custom step)而言，当配置了输出模式(outputSchema)并且步骤被跳过时，框架会尝试验证一个不存在的输出结果，从而产生验证错误。

解决方案探讨

目前有两种可能的解决方案：

简单方案：在步骤状态恢复时也进行skip检查。但这种方法要求开发者的skip函数必须是幂等的，即在多次调用时产生相同的结果。
完整方案：修改框架的桥接层(bridge)，使其能够正确传递步骤被跳过的状态信息。这需要在工作流状态映射(mapState)中包含步骤的跳过状态，并确保工作流引擎能够正确处理这种状态。

值得注意的是，当前框架中已经存在JobStatusEnum.SKIPPED枚举值，但没有找到明确使用它的地方。相反，当isBridgeSkipped为true时，工作流会将任务标记为CANCELED而非SKIPPED，这表明框架在状态处理上可能存在不一致性。