Mongoose 中从字符串到嵌套模式的 Schema 迁移问题解析

2025-05-06 04:56:16作者：卓艾滢Kingsley

问题背景

在使用 Mongoose 进行 MongoDB 数据模型设计时，开发者经常会遇到需要将字段类型从简单类型（如字符串）迁移到复杂类型（如嵌套模式）的情况。本文以一个具体案例为例，探讨当 Schema 从字符串类型迁移到嵌套对象类型时，getter 方法失效的问题及其解决方案。

案例场景

假设我们有一个用户模型，其中包含一个表示时间的字段。最初的设计中，这个时间字段是一个简单的字符串格式（如"12:34"），后来需要改为一个嵌套对象结构（包含小时和分钟两个属性）。

// 旧 Schema
const oldUserSchema = new Schema({
  time: {
    type: String,
    required: true
  }
});

// 新 Schema
const newUserSchema = new Schema({
  time: {
    type: new Schema({
      hours: { type: Number, required: true },
      minutes: { type: Number, required: true }
    }, { _id: false }),
    required: true
  }
});

遇到的问题

在尝试使用 getter 方法进行数据转换时，发现以下问题：

Getter 方法不生效：当文档中存在旧格式的字符串数据时，getter 方法虽然被调用，但转换后的值并未应用到返回的文档中。
Lean 查询问题：使用 lean() 查询时，字符串格式的时间字段未被转换。
类型转换错误：Mongoose 在遇到字符串数据但 Schema 期望对象时会自动将字段值设为 undefined 并存储 CastError。

根本原因分析

这个问题的核心在于 Mongoose 的类型转换机制。当 Schema 定义字段为对象类型但实际数据是字符串时，Mongoose 会在验证阶段抛出类型转换错误，而不是应用 getter 方法。这是 Mongoose 的预期行为，旨在确保数据一致性。

解决方案

1. 使用 pre('init') 钩子

最可靠的解决方案是在模型初始化前对数据进行转换：

newUserSchema.pre('init', function(rawDoc) {
  if (typeof rawDoc.time === 'string') {
    rawDoc.time = timeStringToObject(rawDoc.time);
  }
});

这种方法的特点：

在文档从数据库加载后立即执行
可以处理新旧数据格式的混合情况
需要确保转换函数不会抛出错误

2. 数据迁移方案

对于生产环境，更稳妥的做法是：

编写数据迁移脚本，将所有旧格式数据转换为新格式
部署新 Schema 定义
保留兼容性处理代码一段时间

3. 类型转换函数设计

一个健壮的字符串到时间对象的转换函数示例：

function timeStringToObject(time) {
  if (typeof time !== 'string') return time;
  
  const [hoursStr, minutesStr] = time.split(':');
  const hours = parseInt(hoursStr, 10);
  const minutes = parseInt(minutesStr, 10);
  
  if (isNaN(hours) || isNaN(minutes)) {
    throw new Error(`Invalid time format: ${time}`);
  }
  
  return { hours, minutes };
}