LitServe项目中文件上传时的序列化问题分析与解决方案

2025-06-26 01:25:22作者：管翌锬

问题背景

在使用LitServe框架进行文件上传服务开发时，开发者可能会遇到一个典型的错误："cannot pickle '_io.BufferedRandom' object"。这个问题通常出现在尝试通过HTTP接口上传PDF等文件时，特别是当文件大小超过一定阈值时。

问题现象

当开发者使用LitServe构建文件处理API，并尝试通过requests.post方法上传文件时，服务端可能会抛出序列化错误。具体表现为：

服务端代码接收文件上传请求
尝试处理上传的文件对象时
系统抛出无法序列化BufferedRandom对象的异常

技术分析

这个问题的根本原因在于LitServe内部使用了Python的多进程机制来处理请求，而文件对象（特别是大文件）在跨进程传递时需要被序列化。BufferedRandom对象（文件缓冲区）本身是不可序列化的，这导致了pickle操作失败。

深入分析技术细节：

多进程通信机制：LitServe使用multiprocessing模块的Manager和Queue来实现进程间通信
文件对象特性：Python的文件对象包含状态信息（如文件指针位置），这些信息无法被简单地序列化和反序列化
Starlette版本影响：不同版本的Starlette框架对文件上传的处理方式有所不同，0.46.0版本可能存在相关兼容性问题

解决方案

经过项目维护者的研究和验证，提供了以下几种解决方案：

方案一：降级Starlette版本

将Starlette框架降级到0.45.3版本可以解决此问题：

pip install starlette==0.45.3

方案二：使用Base64编码传输

开发者可以先将文件内容编码为Base64字符串，然后通过JSON格式传输：

import base64

with open(file_path, 'rb') as file:
    file_bytes = file.read()
    file_base64 = base64.b64encode(file_bytes).decode('utf-8')

response = requests.post(url, json={'file': file_base64})

方案三：直接读取文件内容传输

对于小文件，可以直接读取文件内容并通过files参数传输：

with open(file_path, 'rb') as file:
    file_bytes = file.read()

response = requests.post(url, files={'file': ('filename.pdf', file_bytes, 'application/pdf')})