Libwebsockets中消息重复发送问题的分析与解决

2025-06-10 03:33:07作者：贡沫苏Truman

问题现象描述

在使用Libwebsockets库开发WebSocket服务器时，开发者发现一个奇怪的现象：服务器会在5分钟后自动重新发送最后一次接收或发送的消息。这个行为并非开发者有意设计的，而是由底层库的某些机制导致的。

代码分析

从提供的代码来看，这是一个非常基础的WebSocket服务器实现，主要功能是接收客户端消息并广播给所有连接的客户端。关键部分包括：

接收回调(LWS_CALLBACK_RECEIVE)：将接收到的消息存入缓冲区，并标记所有协议实例为可写状态
可写回调(LWS_CALLBACK_SERVER_WRITEABLE)：将缓冲区中的消息发送给客户端

问题根源

问题的核心在于对Libwebsockets库中可写回调机制的理解不足。在Libwebsockets中：

可写请求(LWS_CALLBACK_SERVER_WRITEABLE)并不总是由用户代码通过lws_callback_on_writable()直接触发的
库本身也会因为多种原因(如发送控制操作码、完成部分发送等)触发可写请求
事件循环仅通过位标志来跟踪事件类型(如POLLOUT)，无法区分用户请求和库内部请求

这种设计导致当库消耗一个可写事件时，它会自动添加一个额外的可写请求，以补偿可能被库"抢占"的用户请求。因此，开发者可能会收到比预期更多的可写回调。

解决方案

正确的处理方式是将可写回调视为"有机会写入"的通知，而不是必须写入的命令。修改后的代码逻辑应该是：

只有在确实有新消息需要发送时，才在可写回调中执行发送操作
如果没有新消息需要发送，则直接跳出回调处理

具体到代码实现，可以添加一个标志位来记录是否有新消息需要发送，或者直接清空消息缓冲区来避免重复发送。

最佳实践建议

状态管理：维护明确的状态机来跟踪是否有数据需要发送
缓冲区处理：发送完成后及时清空或标记缓冲区
错误处理：考虑发送失败的情况并实现重试机制
流量控制：在高负载情况下实施适当的流量控制策略

总结

Libwebsockets库的这种设计实际上提供了更大的灵活性，允许库和用户代码共享相同的可写事件机制。理解这一机制对于开发稳定的WebSocket应用至关重要。开发者应该将可写回调视为发送机会而非义务，根据实际需求决定是否发送数据，这样才能避免消息意外重发的问题。

通过这种模式，Libwebsockets既保证了内部操作的顺利进行，又为用户代码提供了充分的机会进行数据发送，实现了库功能与用户需求的平衡。

libwebsockets

canonical libwebsockets.org networking library

项目地址：https://gitcode.com/gh_mirrors/li/libwebsockets

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

413

339

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java