Automerge WASM 同步消息格式错误导致的崩溃问题分析

2025-06-12 20:54:12作者：柯茵沙

问题背景

在Automerge项目中，当使用WebSocket协议进行文档同步时，如果接收到格式不正确的同步消息，WASM模块会出现崩溃现象。这个问题最初在开发者尝试实现automerge-repo WebSockets同步协议时被发现。

问题表现

当开发者发送初始同步消息后，服务器端会立即崩溃，并显示以下错误信息：

TypeError: Cannot read properties of undefined (reading 'length')

错误发生在WASM模块尝试解码同步消息时，表明消息格式存在问题。

技术分析

错误原因

经过深入调查，发现问题根源在于同步消息的JSON结构使用了错误的键名。正确的同步消息应该包含以下字段：

{
    "type": "sync",
    "documentId": "...",
    "senderId": "...",
    "targetId": "...",
    "data": "..."  // 正确的同步数据字段
}

而开发者错误地使用了sync_message作为同步数据的键名，而非协议规定的data键名：

{
    "type": "sync",
    "documentId": "...",
    "senderId": "...",
    "targetId": "...",
    "sync_message": "..."  // 错误的键名
}

同步消息结构

Automerge的同步协议使用CBOR(Concise Binary Object Representation)格式编码消息。一个正确的同步消息应包含：

消息类型(type)：固定为"sync"
文档ID(documentId)：标识同步的文档
发送者ID(senderId)：消息来源标识
目标ID(targetId)：消息接收者标识
数据(data)：实际的同步数据，二进制格式

同步数据内容

同步数据本身也是一个二进制结构，包含以下信息：

变更列表(changes)：需要同步的变更
头部信息(heads)：当前文档的状态
同步状态(have)：已同步的信息
需求列表(need)：需要对方提供的信息

解决方案

要解决这个问题，开发者需要确保：

严格遵循automerge-repo WebSockets同步协议规范
使用正确的字段名"data"而非"sync_message"
确保同步数据的二进制格式正确

最佳实践建议

在实现同步协议时，仔细阅读协议规范文档
使用现有的协议实现作为参考
在开发过程中添加充分的日志记录，便于调试
可以先使用automerge-cli工具验证同步消息的格式是否正确

总结

这个问题展示了协议实现中细节的重要性，即使是键名这样看似微小的差异也可能导致系统崩溃。Automerge的同步机制依赖于严格定义的消息格式，开发者在实现自定义同步时需要特别注意遵循协议规范。

automerge

A JSON-like data structure (a CRDT) that can be modified concurrently by different users, and merged again automatically.

项目地址：https://gitcode.com/gh_mirrors/au/automerge

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

457

446

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

254