PgBouncer连接池中文件描述符激增问题的分析与解决

2025-06-25 15:00:19作者：谭伦延

lightweight connection pooler for PostgreSQL

项目地址：https://gitcode.com/gh_mirrors/pg/pgbouncer

问题现象

在生产环境中，当PgBouncer处理约400个客户端连接时，系统监控显示文件描述符(FD)使用量激增至63k，远超预期。这导致系统出现"Too many open files"错误，影响数据库服务的可用性。

环境配置

系统采用高可用架构，包含三台物理服务器(32GB RAM + 12vCPU)，每台运行：

HAProxy：负载均衡
Patroni：PostgreSQL高可用管理
PgBouncer 1.22.0：连接池
PostgreSQL 12：数据库服务

PgBouncer关键配置：

最大客户端连接数：5000
默认连接池大小：125
最大数据库连接数：250
连接池模式：事务模式

问题诊断

初步排查

文件描述符限制检查：
- 初始系统限制为1024，后提升至64000
- PgBouncer进程限制设置为64000
- PostgreSQL进程限制设置为16384
现象观察：
- 禁用PgBouncer后，FD使用量从64k降至3k
- 启用PgBouncer时，FD使用量随连接数激增

深入分析

使用lsof命令分析各进程FD使用情况：

sudo lsof | cut -d ' ' -f1 | sort | uniq -c | sort -n | tail

结果显示：

PgBouncer：约424个FD
PostgreSQL：高达73615个FD

进一步检查发现PostgreSQL进程打开了大量数据文件：

postgres  3980964  postgres   43u  REG  9,2  170188800  8138552 /var/lib/postgresql/12/main/base/16402/486815881
postgres  3980964  postgres   44u  REG  9,2 1043021824 8130679 /var/lib/postgresql/12/main/base/16402/439059455

根本原因

PostgreSQL配置问题：
- max_files_per_process参数设置为4096（远高于默认值1000）
- 每个PostgreSQL进程可打开大量数据文件
PgBouncer连接池特性：
- 保持与PostgreSQL的持久连接
- 导致PostgreSQL进程长期存在，积累打开的文件描述符
系统级限制：
- fs.file-max系统参数设置为65535
- 不足以应对高并发场景下的FD需求

解决方案

调整PostgreSQL配置：
- 将max_files_per_process恢复为默认值1000
- 添加pg_prewarm到shared_preload_libraries，优化缓存加载
优化PgBouncer配置：
- 降低每个数据库的默认连接池大小至100
- 确保连接池大小与业务需求匹配
提升系统限制：
- 将fs.file-max提高至400k
- 确保系统有足够的FD容量应对峰值
监控与调优：
- 持续监控FD使用情况
- 根据实际负载调整连接池参数

实施效果

经过上述调整后：

系统FD使用峰值降至150k
不再出现"Too many open files"错误
系统资源使用保持稳定

经验总结

连接池不是银弹：PgBouncer虽然能有效管理连接，但需要合理配置才能发挥优势
系统参数需协调：数据库参数、连接池参数和系统限制需要整体考虑
监控至关重要：建立完善的监控体系能快速定位性能瓶颈
循序渐进调优：参数调整应小步快跑，观察效果后再进一步优化

通过这次问题解决，我们深入理解了PgBouncer与PostgreSQL在文件描述符管理上的交互机制，为今后处理类似问题积累了宝贵经验。

lightweight connection pooler for PostgreSQL

项目地址：https://gitcode.com/gh_mirrors/pg/pgbouncer

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库