Zarr-python项目中FSSpecStore与aiohttp资源未关闭问题的分析与解决

2025-07-09 16:11:09作者：傅爽业Veleda

问题背景

在使用zarr-python库的FSSpecStore功能时，特别是与GCSFS或HTTPFilesystem结合使用时，开发者可能会遇到aiohttp资源未正确关闭的问题。这个问题表现为程序运行后控制台输出大量"Unclosed client session"和"Unclosed connector"警告信息，表明底层网络资源没有被正确释放。

问题现象

当开发者使用zarr.open_group()方法打开远程存储（如Google Cloud Storage或HTTP服务器）上的Zarr数据集时，即使程序正常执行完成，也会在控制台看到类似以下的警告输出：

Unclosed client session
client_session: <aiohttp.client.ClientSession object at 0x100f17cb0>
Unclosed connector
connections: ['deque([(<aiohttp.client_proto.ResponseHandler object at 0x103f5bcb0>, ...])']

这些警告表明底层网络连接没有被正确关闭，可能导致资源泄漏，在长期运行的服务中积累可能导致性能问题或连接耗尽。

技术分析

根本原因

这个问题源于fsspec库中文件系统实现（特别是GCSFS和HTTPFilesystem）的会话管理机制。在异步操作完成后，文件系统实例没有正确关闭其内部的aiohttp客户端会话。具体来说：

GCSFS和HTTPFilesystem都使用aiohttp.ClientSession进行网络通信
这些会话应该在不再需要时被显式关闭
当前实现依赖Python的垃圾回收机制来关闭会话，这不可靠且可能导致延迟

问题定位

通过调试发现，GCSFS的close_session方法存在逻辑缺陷。当loop参数为None时，整个方法会直接返回而不执行任何关闭操作。这在zarr-python的使用场景中经常发生，因为zarr管理自己的事件循环。

解决方案

GCSFS的修复

fsspec/gcsfs项目已经通过PR #657修复了这个问题。主要改进包括：

修改close_session方法，不再依赖loop参数
确保在所有情况下都能尝试关闭会话
添加更健壮的异常处理

开发者可以通过以下方式验证修复：

from zarr import open_group

def test():
    z = open_group(
        'gs://bucket/path.zarr', 
        mode='r',
        storage_options={'token': 'anon'})
    members = z.members()
    print(f'Found {len(members)} members')