liburing项目中recv_multishot在多连接场景下的公平性问题分析

2025-06-26 11:57:08作者：伍霜盼Ellen

**liburing：释放现代I/O的强大魔力** liburing是专为高效I/O操作设计的库，它简化了Linux下的io_uring接口，让开发者无需深入内核细节即可利用先进的异步I/O能力。无论你的系统新旧，liburing都能通过其独立于特定内核版本的设计，让你轻松享受最新特性（当然受限于内核支持）。这不仅仅是技术堆砌——它解决了内存锁定限制问题，即便是普通用户也能通过适当配置突破束缚，尽管根用户天然无此顾虑。此外，liburing包含丰富的回归测试，确保性能与稳定性，但请注意，这些测试在较老内核上可能不完全兼容。构建liburing灵活简单，FFI（Foreign Function Interface）支持使其能融入多种编程语言环境。这一项目，以其LGPL/MIT双许可，为追求高性能I/O的应用打开了大门，是Jens Axboe的杰作，引领你进入高效率数据处理的新纪元。

项目地址：https://gitcode.com/gh_mirrors/li/liburing

问题背景

在基于io_uring的高性能网络服务器开发中，recv_multishot结合buf_ring是一种常见的高效数据接收模式。然而在实际部署中，开发者发现当连接数超过一定阈值时，新建立的连接会出现数据接收停滞现象，而原有连接却能继续保持高吞吐量。

现象描述

测试环境采用AWS m5dn.2实例，配备100Gbit网络接口。当服务器同时处理3个客户端连接时，带宽能够公平分配。但当第4个客户端连接后，新连接虽然成功建立，却无法接收到任何数据，表现为：

新连接完全停滞，吞吐量为0
TCP协议栈出现ZeroWindow和Keep-Alive消息交换
只有终止现有连接后，新连接才能开始接收数据

技术分析

核心机制

recv_multishot是io_uring提供的一种高效接收模式，它允许单个提交项持续触发多次完成事件，避免了频繁的系统调用。配合buf_ring缓冲区管理，可以实现零拷贝的高效网络数据处理。

问题根源

经过深入分析，发现问题的本质在于：

内部重试机制失衡：当数据持续高速到达时，内核中的multishot重试机制会导致处理资源分配不均
缓冲区管理问题：即使采用独立的buf_ring，仍可能出现"No buffer space available"错误
SQPOLL模式影响：使用SQPOLL模式时问题表现更为明显

解决方案

内核开发者提出了针对性的修复方案：

重试机制优化：调整multishot内部重试逻辑，确保各连接公平获取处理机会
缓冲区分配策略：改进缓冲区管理算法，防止单一连接独占资源
混合模式支持：建议结合IORING_SETUP_SINGLE_ISSUER和IORING_SETUP_DEFER_TASKRUN使用

实际效果验证

应用修复补丁后：

基础场景下各连接带宽分配达到均衡
在10Gbit链路上，8个客户端均能获得140MiB/s的稳定吞吐
极端情况下仍存在新连接被阻塞的情况，需要进一步优化

最佳实践建议

基于此次问题分析，建议开发者在实现io_uring高性能服务器时：

监控每个连接的吞吐量指标，及时发现分配不均情况
考虑使用最新内核版本，已包含相关修复
在高并发场景下进行充分测试，验证系统行为
根据实际负载特点调整缓冲区大小和并发策略

该问题的解决过程展现了io_uring在极端高性能场景下的微妙行为，也为开发者提供了宝贵的实践经验。未来随着io_uring的持续演进，这类边缘场景的性能表现将得到进一步改善。

**liburing：释放现代I/O的强大魔力** liburing是专为高效I/O操作设计的库，它简化了Linux下的io_uring接口，让开发者无需深入内核细节即可利用先进的异步I/O能力。无论你的系统新旧，liburing都能通过其独立于特定内核版本的设计，让你轻松享受最新特性（当然受限于内核支持）。这不仅仅是技术堆砌——它解决了内存锁定限制问题，即便是普通用户也能通过适当配置突破束缚，尽管根用户天然无此顾虑。此外，liburing包含丰富的回归测试，确保性能与稳定性，但请注意，这些测试在较老内核上可能不完全兼容。构建liburing灵活简单，FFI（Foreign Function Interface）支持使其能融入多种编程语言环境。这一项目，以其LGPL/MIT双许可，为追求高性能I/O的应用打开了大门，是Jens Axboe的杰作，引领你进入高效率数据处理的新纪元。

项目地址：https://gitcode.com/gh_mirrors/li/liburing

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

ohos_react_native

React Native鸿蒙化仓库

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力