AsyncSSH性能优化：解决大文件读取慢的问题

2025-07-10 16:00:30作者：邬祺芯Juliet

AsyncSSH is a Python package which provides an asynchronous client and server implementation of the SSHv2 protocol on top of the Python asyncio framework.

项目地址：https://gitcode.com/gh_mirrors/as/asyncssh

背景介绍

在SFTP文件传输过程中，开发者经常会遇到一个性能问题：当尝试读取超过文件实际大小的字节数时，传输速度会显著下降。这个问题在使用AsyncSSH库进行SFTP操作时尤为明显。本文将深入分析这一问题的根源，并介绍AsyncSSH项目团队如何通过一系列优化措施解决这个问题。

问题现象

当开发者尝试使用AsyncSSH读取一个60MB的文件时，如果请求读取1GB的数据（远超过文件实际大小），传输速度会比直接读取整个文件（使用read(-1)）慢3倍左右。这种性能差异在以下场景中尤为突出：

大文件传输
网络延迟较高的环境
需要频繁随机读取的场景

问题根源分析

经过深入调查，发现问题的核心在于AsyncSSH的并行读取机制：

过度并行化：当请求读取的字节数远超文件大小时，AsyncSSH会尝试并行发起大量读取请求，即使其中很多请求最终不会返回任何数据。
等待机制：系统需要等待所有发出的请求完成，包括那些超出文件范围的无效请求，这造成了不必要的延迟。
压缩默认值：意外发现AsyncSSH默认启用了压缩功能，这在现代高速网络环境下反而会成为性能瓶颈。

解决方案

AsyncSSH开发团队实施了多层次的优化方案：

1. 智能EOF处理

通过在_SFTPParallelIO.iter方法中添加EOF检测逻辑，当遇到文件结束标志时立即停止后续无效请求的等待：

except SFTPEOFError:
    self._bytes_left = 0

这一简单修改使得在读取超出文件范围的请求时，性能从25秒提升到接近正常读取的2秒水平。

2. OpenSSH限制请求支持

实现了对OpenSSH "limits"扩展的支持，自动检测服务器支持的最大读写长度：

客户端默认使用服务器通告的最大值（OpenSSH默认为255KB）
服务器端通告4MB的最大读写大小
保留手动设置block_size的能力

3. 压缩默认值优化

修改了压缩算法的默认顺序，将"none"压缩算法设为优先选择：

register_compression_alg(b'none',
                         _none,         _none,           False, True)
register_compression_alg(b'zlib@openssh.com',
                         _ZLibCompress, _ZLibDecompress, True,  True)

这一改变使得AsyncSSH默认行为与OpenSSH保持一致，避免了不必要的压缩解压开销。

性能对比

优化前后的性能差异显著：

小文件读取：从32MB/s提升到200MB/s
大文件传输：64MB文件传输时间从1.4秒降低到0.3秒
资源利用率：CPU使用率显著降低，特别是在高速网络环境下

最佳实践建议

基于这些优化，建议开发者：

使用最新版AsyncSSH（2.18.0及以上）
避免手动设置过小的block_size
在网络环境良好的情况下禁用压缩
对于大文件传输，合理设置max_requests参数（通常128是个不错的起点）

总结

AsyncSSH通过这一系列优化，显著提升了SFTP文件传输的性能，特别是在处理大文件和网络延迟较高的场景下。这些改进不仅解决了特定情况下的性能问题，还为整个库的稳定性和效率带来了全面提升。开发者现在可以更高效地处理各种SFTP文件操作，而无需担心意外的性能下降问题。

这些优化措施已经包含在AsyncSSH 2.18.0及更高版本中，建议所有用户升级以获得最佳性能体验。

asyncssh

AsyncSSH is a Python package which provides an asynchronous client and server implementation of the SSHv2 protocol on top of the Python asyncio framework.

项目地址：https://gitcode.com/gh_mirrors/as/asyncssh

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677