Reqwest中Gzip解码器在TCP分块传输时的过早返回问题分析

2025-05-22 19:29:30作者：郁楠烈Hubert

问题背景

在使用Rust的reqwest库进行HTTP请求时，当服务器返回分块传输编码(gzip压缩)的响应体且TCP层出现数据分片时，Gzip解码器可能会过早地返回结果，导致连接无法被正确回收和重用。这个问题虽然不影响响应数据的正确性，但会显著影响连接池的效率。

问题现象

当客户端启用gzip功能并向服务器发送请求时，如果服务器返回分块传输的gzip压缩体，且这些数据在TCP层被分片传输(分片之间有明显时间间隔)，Gzip解码器会在解码完最后一个压缩字节后立即返回，而不等待完整的响应体到达。这导致Response对象被过早释放，而底层连接仍在等待服务器发送剩余数据，从而无法被放回连接池重用。

技术分析

问题的根本原因在于async-compression库的默认行为：GzipDecoder在完成当前压缩成员解码后会立即报告流结束。这种行为对于分块传输编码的响应是不合适的，因为它无法正确处理TCP层分片的情况。

解决方案

通过深入研究async-compression库的实现，发现可以通过设置multiple_members(true)来改变这一行为。这个选项告诉解码器可能存在多个压缩成员，需要继续等待更多数据而不是在第一个成员解码完成后就结束。

在reqwest的实现中，需要在构建GzipDecoder时显式启用这个选项：

let mut d = GzipDecoder::new(StreamReader::new(_body));
d.multiple_members(true);

实现考量

适用场景：这个修改对于分块传输编码和带有正确Content-Length头的响应都能正常工作
特殊情况处理：当响应既没有Transfer-Encoding也没有Content-Length头时，启用multiple_members可能导致处理挂起。根据HTTP规范，这种情况虽然不常见但也是合法的
多资源体处理：对于包含多个资源的响应体(如多部分响应)，需要额外考虑解码器的处理逻辑