Pymodbus异步TCP服务器文件描述符泄漏问题分析与解决

2025-07-03 08:06:48作者：姚月梅Lane

问题背景

在使用Pymodbus库开发Modbus TCP异步服务器时，开发者可能会遇到一个棘手的问题：当客户端频繁连接和断开时，服务器会逐渐积累大量未释放的文件描述符，最终导致"Too many open files"错误，使服务器无法继续接受新连接。

问题现象

典型的错误表现为：

服务器运行一段时间后停止响应
系统日志中出现"OSError: [Errno 24] Too many open files"错误
具体报错指向socket.accept()操作失败

技术分析

根本原因

在Pymodbus 3.7.4版本中，异步TCP服务器的传输层实现存在一个设计缺陷。当客户端连接断开时，服务器会触发connection_lost回调，其中包含一个do_relisten()操作。这个机制原本是为了在意外断开后自动恢复监听，但在某些情况下会导致文件描述符未能正确释放。

问题复现

通过以下测试代码可以稳定复现该问题：

服务器端代码：

from pymodbus.datastore.context import ModbusSequentialDataBlock
from pymodbus.datastore import ModbusServerContext, ModbusSlaveContext
from pymodbus.server import ModbusTcpServer
import asyncio

data = ModbusSequentialDataBlock(1, [0] * 32)
slaveContext = ModbusSlaveContext(di=data)
context = ModbusServerContext(slaveContext, single=True)

async def run_forever():
    server = ModbusTcpServer(context, address=("0.0.0.0", 5002))
    await server.serve_forever()

asyncio.run(run_forever())

客户端测试代码：

from pymodbus.client import ModbusTcpClient

for i in range(2048):
    client = ModbusTcpClient('localhost', port=5002)
    client.connect()
    result = client.read_coils(2, 3, slave=1)
    print(result.bits[0])
    client.close()
    if i == 1024:
        time.sleep(1.5)

问题定位

关键问题出在transport.py文件的第292行附近，当连接丢失时，服务器会无条件地尝试重新监听，而没有正确处理之前的连接资源释放。

解决方案

该问题已在Pymodbus的dev分支中通过提交ea326725d1a4d18c5bb30777be50b36d91d77ab3得到修复。主要改进包括：

优化了连接断开时的资源清理流程
改进了文件描述符的管理机制
增强了异常处理逻辑

最佳实践建议

对于生产环境使用Pymodbus异步服务器的开发者，建议：

使用最新版本的Pymodbus库
监控服务器的文件描述符使用情况
定期重启服务作为临时解决方案（如果无法立即升级）
对于高频率连接场景，考虑实现连接池机制

总结

文件描述符泄漏是网络服务器开发中的常见问题，Pymodbus团队已经在新版本中修复了这一问题。开发者应当注意及时更新依赖库，并在开发过程中加入资源泄漏检测机制，以确保服务的长期稳定运行。

对于Modbus客户端开发，也需要注意类似的资源管理问题，特别是在频繁创建和销毁连接的场景下，合理的连接复用策略可以显著提高系统稳定性。

pymodbus

A full modbus protocol written in python

项目地址：https://gitcode.com/gh_mirrors/py/pymodbus

登录后查看全文