Mongoose 事务重试中的数组操作问题解析

2025-05-06 09:01:29作者：沈韬淼Beryl

问题背景

在使用 Mongoose 8.6.0 版本与 MongoDB 5 配合时，开发者在事务处理中发现了一个关于数组操作的严重问题。当文档中的子文档数组通过 push() 或 addToSet() 方法修改后，在事务重试过程中会出现数据重复的问题。

问题现象

具体表现为：

文档包含一个子文档数组
使用 push() 方法向数组添加元素
在事务中保存(save())文档
事务需要重试时(整个事务重试而非仅提交重试)

结果会导致数组中添加的元素数量呈指数级增长，遵循 2^n 规律(n为重试次数)。例如：

第一次重试：2个相同元素
第二次重试：4个相同元素
第三次重试：8个相同元素
以此类推

技术分析

通过分析 MongoDB 的更新操作日志，可以清楚地看到问题所在：

第一次保存操作生成的更新语句：

{
  "$push": {
    "items": {
      "$each": [{"name":"test3"}]
    }
  },
  "$inc": {"__v":1}
}

第二次重试生成的更新语句：

{
  "$set": {"__v":1},
  "$push": {
    "items": {
      "$each": [{"name":"test3"},{"name":"test3"}]
    }
  }
}

第三次重试生成的更新语句：

{
  "$set": {"__v":1},
  "$push": {
    "items": {
      "$each": [{"name":"test3"},{"name":"test3"},{"name":"test3"},{"name":"test3"}]
    }
  }
}

可以看到，每次重试时 $push.items.$each 数组中的元素数量都会翻倍，这直接导致了数据的重复问题。

影响范围

这个问题主要影响以下数组操作方法：

push()
addToSet()

其他数组操作方法如 pop()、pull()、remove()、set()、shift() 和 splice() 则表现正常。

潜在风险

除了数据重复外，这个问题还会带来两个潜在风险：

更新查询体积膨胀：随着重试次数增加，更新查询的体积会急剧增长
操作失败风险：当查询体积超过 MongoDB 的限制(16MB)时，操作会失败并抛出以下错误之一：
```
RangeError: The value of "offset" is out of range...
MongoServerError: BSONObj size: 16928643 is invalid...
```

临时解决方案

在官方修复前，可以采用以下临时解决方案：

await mongoose.connection.transaction(async (session) => {
  // 重置数组字段，清除内部状态
  doc.items = doc.items;
  
  await doc.save({ session });
  
  // 重试逻辑...
});

这个方法通过重新赋值数组字段来重置 Mongoose 文档的内部状态，确保每次重试时都能正确生成更新语句。