HAProxy 2.9.9版本中的Socket/Session泄漏问题深度解析

2025-06-07 23:39:36作者：薛曦旖Francesca

问题现象与背景

在AWS EC2环境中运行的HAProxy 2.9.9集群中，运维团队观察到一个严重的资源泄漏问题。特定区域的节点会突然出现会话数和吞吐量的异常飙升，而实际连接数却保持稳定。问题节点的典型表现为：

通过对问题节点的深入排查，技术团队发现了几个关键现象：

进一步分析表明，当后端服务(Squid等)主动发起连接关闭时，HAProxy未能正确处理FIN/ACK包，导致连接长时间停留在CLOSE_WAIT状态，等待超时而非立即关闭。

问题的核心在于HAProxy 2.9.9版本的HTTP/1.1多路复用器(mux-h1)实现中存在一个严重缺陷。当启用零拷贝转发时，系统在某些情况下无法正确唤醒流连接(SC)来执行零拷贝转发操作，特别是在处理被动关闭(由服务器端发起的连接终止)场景时。

这种实现缺陷导致：

HAProxy开发团队迅速响应并提供了修复方案。核心修复包括：

验证结果表明，应用修复补丁后：

基于此次事件，我们建议HAProxy用户：

这次HAProxy的socket/session泄漏问题展示了现代网络代理中零拷贝优化可能带来的复杂性。通过社区协作和及时的问题响应，不仅解决了具体的技术问题，也为分布式系统下的连接管理提供了宝贵经验。运维团队应当建立完善的版本跟踪机制，对核心网络组件保持适度谨慎的升级策略。

登录后查看全文