WuKongIM即时通讯协议详解
2026-02-04 05:06:43作者:滕妙奇
协议概述
WuKongIM是一款高效、可靠的即时通讯协议,专为现代即时通讯应用设计。该协议采用二进制格式,具有结构紧凑、传输效率高、安全性好等特点。本文将深入解析WuKongIM协议的各个组成部分,帮助开发者更好地理解和实现该协议。
协议结构
WuKongIM协议采用分层设计,每个控制报文由三部分组成:
- 固定报头(Fixed Header):2字节,包含报文类型和标志位
- 可变报头(Variable Header):长度可变,根据报文类型不同而不同
- 有效载荷(Payload):实际传输的数据内容
这种分层设计使得协议既保持了灵活性,又能保证高效的传输效率。
固定报头详解
固定报头是每个控制报文都必须包含的部分,长度为2字节,结构如下:
第1字节
- 高4位(bit7-bit4):控制报文类型
- 低4位(bit3-bit0):标志位
第2字节
- 剩余长度(Remaining Length),表示可变报头和有效载荷的总长度
控制报文类型
WuKongIM定义了10种控制报文类型:
| 类型名称 | 值 | 描述 |
|---|---|---|
| Reserved | 0 | 保留位 |
| CONNECT | 1 | 客户端连接请求(c2s) |
| CONNACK | 2 | 服务端连接确认(s2c) |
| SEND | 3 | 发送消息(c2s) |
| SENDACK | 4 | 消息发送确认(s2c) |
| RECVEIVED | 5 | 接收消息(s2c) |
| REVACK | 6 | 接收消息确认(c2s) |
| PING | 7 | 心跳请求 |
| PONG | 8 | 心跳响应 |
| DISCONNECT | 9 | 断开连接请求 |
标志位
标志位占用4个bit,含义如下:
| 标志位名称 | 描述 |
|---|---|
| DUP | 是否是重复消息(客户端重发时设为1) |
| SyncOnce | 是否只同步一次(多设备场景下使用) |
| RedDot | 客户端收到消息是否显示红点 |
| NoPersist | 是否不存储此消息 |
剩余长度编码
WuKongIM采用变长编码表示剩余长度,最多使用4个字节:
- 每个字节使用7位表示数值,最高位(bit7)为延续位
- 延续位为1表示还有后续字节,为0表示这是最后一个字节
- 数值计算采用小端序,第一个字节是最低位
这种编码方式可以高效地表示0-256MB的数据长度。
可变报头和有效载荷
可变报头的内容根据报文类型不同而变化,主要包含一些控制信息和元数据。有效载荷则是实际传输的消息内容。
主要报文类型详解
1. CONNECT - 连接请求
客户端发起连接时发送,包含以下字段:
- Protocol Version:协议版本号
- UID:用户ID
- Token:认证令牌
- Client Key:客户端DH公钥(Base64编码)
- Device Flag:设备标识(用于同账号互踢)
- Device ID:设备唯一ID
- Client Timestamp:客户端时间戳(13位毫秒)
2. CONNACK - 连接确认
服务端响应连接请求,包含:
- Server Key:服务端DH公钥
- Salt:安全码
- Time Diff:客户端与服务端时间差(毫秒)
- Reason Code:连接结果状态码
3. SEND - 发送消息
客户端发送消息时使用,主要字段:
- Setting:消息设置(1字节)
- Msg Key:消息验证密钥
- Client Seq:客户端消息序列号
- Client Msg No:客户端消息唯一标识(去重用)
- Channel Id:频道ID
- Channel Type:频道类型(1:个人 2:群组)
- Payload:加密的消息内容
4. SENDACK - 发送确认
服务端确认消息接收,包含:
- Client Seq:客户端消息序列号
- Message ID:服务端分配的消息ID(全局唯一)
- Message Seq:消息序号(用户唯一,有序递增)
- Reason Code:发送结果状态码
5. RECV - 接收消息
服务端向客户端推送消息,字段包括:
- Setting:消息设置
- Msg Key:消息验证密钥
- Message ID:服务端消息ID
- Message Seq:消息序号
- Client Msg No:客户端消息唯一标识
- Message Timestamp:服务器时间戳(10位秒)
- Channel ID/Type:频道信息
- From UID:发送者ID
- Payload:加密的消息内容
6. RECVACK - 接收确认
客户端确认消息接收,包含:
- Message ID:服务端消息ID
- Message Seq:消息序号
7. PING/PONG - 心跳机制
用于保持连接活跃,检测连接状态。
8. DISCONNECT - 断开连接
主动断开连接时使用,包含:
- ReasonCode:断开原因代码
- Reason:断开原因描述
消息设置
消息设置占用1字节(8bit),目前定义如下:
| 位 | 名称 | 描述 |
|---|---|---|
| 7 | Receipt | 是否需要已读回执(1:需要) |
| 6-0 | Reserved | 保留位 |
消息内容格式建议
WuKongIM推荐使用JSON格式组织消息内容,支持多种消息类型:
基础消息类型
- 文本消息
{
"type": 1,
"content": "消息内容"
}
- 图片消息
{
"type": 2,
"url": "图片URL",
"width": 200,
"height": 300
}
- 语音消息
{
"type": 4,
"url": "语音URL",
"timeTrad": 10
}
高级功能
- @提及功能
{
"type": 1,
"content": "消息内容",
"mention": {
"all": 0,
"uids": ["uid1", "uid2"]
}
}
- 消息回复
{
"type": 1,
"content": "回复内容",
"reply": {
"message_id": "被回复消息ID",
"from_uid": "发送者UID",
"payload": {} // 被回复消息内容
}
}
- 命令消息
{
"type": 99,
"cmd": "commandName",
"param": {}
}
系统消息规范
系统消息(type≥1000)用于通知类信息,如群组操作等:
- 创建群组
{
"type": 1001,
"creator": "创建者UID",
"content": "{0}创建了群组",
"extra": [{"uid":"xxx","name":"张三"}]
}
- 群成员变动
{
"type": 1002,
"content": "{0}邀请了{1}加入群组",
"extra": [{"uid":"创建者UID","name":"张三"},{"uid":"新成员UID","name":"李四"}]
}
- 消息撤回
{
"type": 1006,
"message_id": "被撤回消息ID",
"content": "{0}撤回了一条消息",
"extra": [{"uid":"操作者UID","name":"张三"}]
}
最佳实践建议
- 消息去重:使用Client Msg No确保消息唯一性
- 消息顺序:依赖Message Seq保证消息有序性
- 安全性:务必验证Msg Key防止消息篡改
- 状态同步:合理使用SyncOnce标志优化多设备同步
- 心跳机制:建议每30-60秒发送一次PING保持连接
通过本文的详细解析,开发者可以全面了解WuKongIM协议的设计理念和实现细节,为开发基于该协议的即时通讯应用打下坚实基础。
登录后查看全文
热门项目推荐
相关项目推荐
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin08
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
532
3.75 K
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
12
1
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
67
20
暂无简介
Dart
772
191
Ascend Extension for PyTorch
Python
340
405
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
886
596
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
23
0
React Native鸿蒙化仓库
JavaScript
303
355
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
336
178