Granian项目性能优化：使用独立监听套接字提升多核利用率

2025-06-24 11:56:51作者：史锋燃Gardner

在构建高性能Web服务时，充分利用多核CPU资源是提升吞吐量的关键。Granian项目近期通过一项重要优化，显著提升了多工作进程/线程模式下的负载均衡能力，使CPU密集型应用能够更好地发挥多核优势。

问题背景

传统多工作进程架构通常采用共享监听套接字的方式，主进程创建套接字后，所有工作进程通过继承方式共享同一个监听端口。这种方式存在一个明显的性能瓶颈：当工作进程数量较多（超过4个）且应用存在CPU密集型操作时，连接请求往往集中在少数几个工作进程上，导致负载分布不均。

这种现象源于操作系统内核的accept机制。在共享套接字模式下，多个工作进程需要竞争同一个accept队列，这种竞争关系会导致"惊群效应"，最终只有部分工作进程能获得处理连接的机会。

技术解决方案

Linux内核从3.9版本开始引入了SO_REUSEPORT套接字选项，FreeBSD也提供了类似的SO_REUSEPORT_LB功能。这些特性允许多个套接字绑定到相同的IP地址和端口组合，内核会自动将新连接均匀分配到各个监听套接字上。

Granian项目通过以下改进实现了这一优化：

每个工作进程创建独立的监听套接字
设置SO_REUSEPORT选项（Linux）或SO_REUSEPORT_LB（FreeBSD）
各工作进程独立进行bind和listen操作

性能对比

在实际测试中，使用16个工作进程处理HTTP请求，结果显示：

传统共享套接字模式：

吞吐量：约1,694请求/秒
请求处理时间：平均55.6ms
实际活跃工作进程：仅4-5个

独立套接字优化后：

吞吐量：约8,489请求/秒（提升5倍）
请求处理时间：平均11.15ms（降低80%）
所有16个工作进程均匀负载

实现细节

值得注意的是，优化实现中发现只需在各工作进程中执行listen()操作即可，bind()操作可以由主进程完成。这一发现可以进一步减少每个工作进程的文件描述符消耗，虽然现代系统通常对文件描述符数量限制较为宽松，但在极端高并发场景下仍有一定价值。

适用场景

这种优化特别适合以下类型的应用：

CPU密集型Web应用（如Django等框架）
突发流量场景
高并发短连接场景（HTTP Keep-Alive禁用时效果更明显）

对于纯I/O密集型应用，由于工作进程大部分时间处于等待状态，优化效果可能不太显著。

版本支持

该优化已随Granian 2.2.2版本发布。用户需要注意：

Linux系统需要内核版本≥3.9
FreeBSD系统需要支持SO_REUSEPORT_LB
旧版本系统可通过配置参数回退到传统模式

这项改进使得Granian在高性能Python Web服务领域又向前迈进了一步，特别是为需要处理突发流量的生产环境提供了更可靠的性能保障。

granian

A Rust HTTP server for Python applications

项目地址：https://gitcode.com/gh_mirrors/gr/granian

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

392

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.67 K

987