BullMQ 任务去重机制在延迟任务中的问题分析

2025-06-01 16:02:20作者：邬祺芯Juliet

背景介绍

BullMQ 是一个基于 Redis 的 Node.js 消息队列库，提供了强大的任务队列功能。其中一项重要特性是任务去重（deduplication），通过为任务指定去重 ID 可以避免重复创建相同任务。

问题现象

在使用 BullMQ 的去重功能时，发现当存在延迟任务的情况下，去重机制出现了异常。具体表现为：

当第一个任务被设置为延迟执行状态时
如果此时创建第二个具有相同去重 ID 的任务
系统没有正确识别已有延迟任务，导致重复创建

技术原理分析

BullMQ 的去重机制核心是通过 Redis 存储去重键值对实现的。每个去重 ID 会对应一个 Redis 键，值为任务 ID。当新任务到达时，系统会检查该去重 ID 是否已存在。

问题的根源在于延迟任务状态下的去重键处理逻辑存在缺陷。当原始任务失败后被手动删除时，系统会调用 removeDeduplicationKey Lua 脚本移除去重键，但没有验证当前去重键对应的任务 ID 是否与正在删除的任务匹配。

解决方案

社区贡献者提出了修复方案，核心思想是在移除去重键前增加验证步骤：

获取待删除任务对应的去重 ID
检查 Redis 中该去重键当前存储的任务 ID
只有两者匹配时才执行删除操作

修复后的 Lua 脚本逻辑如下：

local function removeDeduplicationKey(prefixKey, jobKey)
  local deduplicationId = rcall("HGET", jobKey, "deid")
  if deduplicationId then
    local deduplicationKey = prefixKey .. "de:" .. deduplicationId
    local currentValue = rcall("GET", deduplicationKey)
    if currentValue == jobKey then
      rcall("DEL", deduplicationKey)
    end
  end
end