Requests库中生成器函数实现分块上传的技术解析

2025-04-30 07:15:55作者：凤尚柏Louis

在Python的Requests库使用过程中，开发者经常需要处理大文件上传的场景。传统的一次性加载整个文件内容到内存的方式显然不适合大文件传输，这时就需要采用分块传输编码(Chunked Transfer Encoding)技术。

问题现象

当开发者尝试使用生成器函数作为数据源进行分块上传时，可能会遇到两种典型错误：

类型错误："memoryview: a bytes-like object is required, not 'str'"
400错误请求响应

这些问题的根源在于Requests库对生成器返回值的处理方式以及HTTP协议对分块传输的要求。

技术背景

HTTP分块传输编码允许服务器在不知道内容长度的情况下逐步接收数据。在Python中，这通常通过生成器函数实现，生成器可以yield出数据块，实现流式传输。

解决方案

1. 数据类型处理

在Requests 2.28.1及更早版本中，生成器必须返回bytes类型而非str类型。这是因为HTTP协议底层传输需要的是字节流而非字符串。正确的做法是：

def chunk_generator():
    yield b'{"field": "value",'  # 注意b前缀表示bytes
    yield b'"field2": "value2"}'

2. 生成器函数设计

开发者需要注意生成器函数的几个关键点：

使用yield而非return来产生数据块
最后一个yield语句后不应有return语句（除非返回None）
每个数据块应该是完整的、可解析的数据单元

3. 版本兼容性

从Requests 2.29.0版本开始，库内部对生成器返回值处理进行了优化。但在旧版本中，开发者需要自行确保返回bytes类型数据。

最佳实践

对于需要兼容不同Requests版本的项目，可以采用以下模式：

def safe_chunk_generator():
    chunks = [
        '{"field": "value",',
        '"field2": "value2"}'
    ]
    for chunk in chunks:
        if isinstance(chunk, str):
            yield chunk.encode('utf-8')
        else:
            yield chunk

性能考虑

使用生成器进行分块上传时，还需要注意：

合理设置块大小（通常在几KB到几十KB之间）
避免在生成器中进行复杂计算，以免影响传输速度
考虑网络环境和服务器配置调整块大小

总结

Requests库的分块上传功能为处理大文件传输提供了便利，但需要开发者注意数据类型和生成器实现的细节。随着库版本的更新，这些限制可能会逐步放宽，但理解底层原理对于编写健壮的传输代码仍然至关重要。

对于生产环境，建议：

尽可能升级到较新的Requests版本
明确数据类型转换
充分测试不同网络条件下的传输稳定性

requests

A simple, yet elegant, HTTP library.

项目地址：https://gitcode.com/GitHub_Trending/re/requests

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

336

178

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

Requests库中生成器函数实现分块上传的技术解析

问题现象

技术背景