Async-GraphQL 中 BSON 扩展 JSON 表示的支持与实现

2025-06-24 14:25:06作者：钟日瑜

在 MongoDB 生态系统中，BSON 作为一种二进制 JSON 格式，广泛应用于数据存储和传输。为了在不同系统间交换数据，BSON 定义了一种扩展的 JSON 表示形式，这种表示方式能够保留 BSON 特有的数据类型信息。本文将深入探讨如何在 async-graphql 项目中实现对 BSON 扩展 JSON 表示的支持。

BSON 扩展 JSON 表示的重要性

BSON 扩展 JSON 表示解决了标准 JSON 无法完整表达 BSON 特有数据类型的问题。例如，MongoDB 中的 ObjectId 和 UUID 等特殊类型，在标准 JSON 中只能表示为字符串，丢失了其类型语义。扩展 JSON 通过引入特殊标记（如 $binary、$uuid 等）来保持这些类型的完整性。

在 GraphQL 应用中，正确处理这些扩展表示对于确保数据在客户端和服务端之间无损传输至关重要。特别是当 GraphQL 服务作为 MongoDB 的前端时，保持这些类型的语义一致性显得尤为重要。

当前实现的问题分析

async-graphql 目前对 BSON 类型的支持存在一个关键限制：它只能处理这些类型的简单字符串表示，而无法识别和处理它们的扩展 JSON 表示形式。具体表现为：

UUID 类型：
- 简单表示："f136c009-e465-4f69-9170-8e898b1f9547"
- 扩展表示：{ "$binary": { "base64": "...", "subType": "04" } }
ObjectId 类型：
- 简单表示："507f1f77bcf86cd799439011"
- 扩展表示：{ "$oid": "507f1f77bcf86cd799439011" }

这种不一致性会导致数据在通过 GraphQL 接口传输时丢失类型信息，或者在接收扩展表示时无法正确解析。

技术实现方案

要解决这个问题，我们需要在 async-graphql 的 ScalarType 实现中同时支持两种表示形式。以下是关键实现要点：

1. UUID 类型的双模式支持

对于 bson::Uuid 类型，ScalarType 的实现需要能够：

解析简单的字符串格式 UUID
解析扩展的二进制表示格式
序列化时可以选择输出格式（根据上下文需求）

impl ScalarType for bson::Uuid {
    fn parse(value: Value) -> InputValueResult<Self> {
        match value {
            // 处理字符串格式
            Value::String(s) => Ok(bson::Uuid::parse_str(&s)?),
            // 处理扩展的二进制格式
            Value::Object(obj) => {
                if let Some(binary) = obj.get("$binary") {
                    // 解析二进制数据...
                } else {
                    Err(InputValueError::expected_type(value))
                }
            }
            _ => Err(InputValueError::expected_type(value)),
        }
    }
    
    fn to_value(&self) -> Value {
        // 可根据需要返回简单或扩展表示
        Value::String(self.to_string())
    }
}

2. ObjectId 类型的兼容处理

类似地，对于 bson::ObjectId 需要支持：

24 位十六进制字符串表示
包含 $oid 字段的对象表示

impl ScalarType for bson::ObjectId {
    fn parse(value: Value) -> InputValueResult<Self> {
        match value {
            Value::String(s) => Ok(bson::ObjectId::parse_str(&s)?),
            Value::Object(obj) => {
                if let Some(oid) = obj.get("$oid") {
                    // 解析ObjectId...
                } else {
                    Err(InputValueError::expected_type(value))
                }
            }
            _ => Err(InputValueError::expected_type(value)),
        }
    }
}