Langchain-Chatchat项目中文件描述符耗尽问题的分析与解决

2025-05-03 00:32:48作者：温艾琴Wonderful

问题背景

在Langchain-Chatchat项目的实际部署中，特别是在使用vLLM进行高并发推理时，系统可能会遇到"[Errno 24] Too many open files"的错误。这个错误通常发生在系统尝试打开kb_settings.yaml配置文件时，而此时系统的文件描述符资源已经耗尽。监控数据显示，当并发量较高时，该文件的描述符使用量会达到500-600个，远超普通应用的正常水平。

技术原理分析

文件描述符是操作系统用来管理打开文件的一种机制，每个进程都有其可用的文件描述符数量上限。当应用程序频繁打开文件而没有及时关闭时，就会导致描述符资源被耗尽。在Langchain-Chatchat项目中，kb_settings.yaml作为知识库配置文件，在高并发场景下被反复读取，如果每次请求都独立打开文件而不进行资源管理，就会快速消耗系统资源。

解决方案

系统层面优化

调整系统文件描述符限制
可以通过修改/etc/security/limits.conf文件来永久提高限制：
```
* soft nofile 65535
* hard nofile 65535
```
修改后需要重新登录使设置生效。
检查当前限制
使用ulimit -n命令可以查看当前用户的文件描述符限制，cat /proc/sys/fs/file-max可以查看系统级别的总限制。

应用层面优化

实现配置文件缓存
在应用启动时一次性读取kb_settings.yaml文件内容，并将其缓存在内存中，避免每次请求都重新打开文件。可以设计一个配置管理单例类来统一管理配置数据的访问。
优化文件访问模式
使用with语句确保文件描述符被正确释放：
```
with open('kb_settings.yaml', 'r') as f:
    config = yaml.safe_load(f)
```
并发控制机制
对于必须频繁访问的文件，实现读写锁机制或使用线程安全的数据结构来管理配置访问。
资源监控与告警
在应用中集成资源监控功能，当文件描述符使用量接近阈值时发出告警，便于及时处理。