libhv项目中UDP/KCP协议的多线程安全发送问题解析

2025-05-31 20:38:28作者：平淮齐Percy

🔥 比libevent/libuv/asio更易用的网络库。A c/c++ network library for developing TCP/UDP/SSL/HTTP/WebSocket/MQTT client/server.

项目地址：https://gitcode.com/gh_mirrors/li/libhv

问题背景

在libhv网络库中，当使用UDP、KCP或IP协议进行网络通信时，存在一个潜在的多线程安全问题。具体表现为：当非I/O回调线程调用hio_set_peeraddr设置发送目标地址后，再调用hio_write发送数据时，系统会使用io->peeraddr作为发送地址。然而，如果此时事件循环线程中接收到来自不同来源或端口的数据包（通过__nio_read->recvfrom），可能会意外修改io->peeraddr的值，导致后续hio_write->sendto操作使用错误的发送目标地址。

问题分析

这个问题本质上是一个典型的多线程资源竞争问题。io->peeraddr作为共享资源，被两个不同的执行路径访问和修改：

用户线程路径：hio_set_peeraddr -> 设置io->peeraddr
事件循环线程路径：接收数据 -> recvfrom -> 更新io->peeraddr

当这两个路径并发执行时，就会产生竞争条件，导致发送目标地址被意外修改。

现有解决方案的局限性

目前常见的临时解决方案包括：

使用定时器或runInLoop确保操作在I/O线程中执行
通过同步机制保护peeraddr的访问

但这些方案都存在明显缺陷：

定时器或runInLoop会引入额外的线程切换开销
与函数描述的thread-safe特性不符
TCP模式下可以直接安全调用hio_write，而UDP模式却需要特殊处理，行为不一致
即使使用队列，如果try_write失败进入写队列，peeraddr仍可能被修改

技术实现方案比较

针对这个问题，可以考虑以下几种技术方案：

分离地址存储方案：
- 增加io->writeaddr成员和hio_set_writeaddr方法
- 将接收地址(peeraddr)和发送地址(writeaddr)分离
- 需要调用者确保set和write操作的同步
参数传递方案：
- 修改hio_write接口，增加addr参数
- 当addr不为NULL时，使用指定地址发送
- try_write失败时将地址信息存入写队列
新增专用接口方案：
- 保持hio_write不变
- 新增hio_sendto接口专门用于指定目标地址发送
- 地址信息通过栈传递，避免共享资源竞争

项目维护者的解决方案

项目维护者最终选择了新增hio_sendto接口的方案，主要基于以下考虑：

直接传入peeraddr的方式可以避免共享资源竞争
保持现有hio_write接口不变，兼容已有代码
实现简单直接，不需要复杂的同步机制
符合UDP编程的常规模式(sendto/recvfrom)

同时，维护者也指出了当前写队列实现的一个限制：目前的写队列没有保存发送地址信息，因此不完全适用于UDP协议的非阻塞写操作。当前的UDP实现采用了阻塞方式，当系统发送缓冲区满时会一直等待，不会进入try_write逻辑。未来如果需要支持UDP的非阻塞写，还需要对写队列进行改造以支持地址信息的保存。

最佳实践建议

对于libhv用户，在使用UDP/KCP协议时，建议：

优先使用新增的hio_sendto接口进行数据发送
如果必须使用hio_set_peeraddr+hio_write组合，确保在同一个线程中连续调用
对于高性能场景，考虑实现应用层的发送队列和地址管理
注意UDP发送的阻塞特性，合理设置发送缓冲区大小

总结

多线程环境下的网络编程需要特别注意共享资源的安全访问。libhv通过新增专用接口的方式解决了UDP/KCP协议发送地址的线程安全问题，既保持了API的简洁性，又提供了必要的线程安全保障。这个案例也提醒我们，在设计网络库API时，需要充分考虑不同协议的特性和多线程环境下的使用场景。

🔥 比libevent/libuv/asio更易用的网络库。A c/c++ network library for developing TCP/UDP/SSL/HTTP/WebSocket/MQTT client/server.

项目地址：https://gitcode.com/gh_mirrors/li/libhv

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。