解决docTR API在FastAPI集成中的内存泄漏问题

2025-06-12 16:50:40作者：庞眉杨Will

问题背景

在将docTR OCR库集成到FastAPI框架构建的API服务时，开发人员发现了一个严重的内存泄漏问题。当系统处理大量OCR请求时，内存使用量会持续攀升且不会回落，最终可能导致服务因内存耗尽而崩溃。这个问题在CPU环境下尤为明显，严重影响了服务的稳定性和可靠性。

问题现象

通过压力测试可以观察到以下典型现象：

初始内存使用量约为381MB（根据系统配置有所不同）
随着请求数量增加（如500次连续请求），内存使用量逐步上升
请求处理完成后，内存不会释放回初始水平
后续请求会使内存继续累积，形成明显的"阶梯式"增长模式

根本原因分析

经过深入排查，发现内存泄漏问题主要与两个因素有关：

多进程处理机制：docTR默认启用的多进程处理在某些环境下（特别是Windows系统）可能导致资源无法正确释放
计算原语缓存：深度学习框架使用的计算库会缓存计算原语以提高性能，但在持续处理请求的场景下，这种缓存机制可能导致内存累积

解决方案

通过设置以下两个环境变量，可以有效解决内存泄漏问题：

export DOCTR_MULTIPROCESSING_DISABLE=TRUE
export PRIMITIVE_CACHE_CAPACITY=1

参数说明

DOCTR_MULTIPROCESSING_DISABLE=TRUE：禁用docTR的多进程处理功能，改用单进程模式
PRIMITIVE_CACHE_CAPACITY=1：限制计算库的原语缓存大小为1，防止缓存无限增长

性能影响与优化建议

虽然上述解决方案有效解决了内存泄漏问题，但也需要考虑对性能的影响：

禁用多进程处理可能会略微降低高并发下的吞吐量
限制缓存大小可能导致重复计算，增加CPU负载

对于生产环境，建议考虑以下优化措施：

使用专门的OCR服务如OnnxTR，它针对硬件进行了更多优化
在容器编排环境中设置适当的内存限制和自动伸缩策略
定期监控服务的内存使用情况，建立监控机制

验证结果

经过两周的持续监控和压力测试，确认该解决方案能够稳定控制内存使用量，服务不再出现内存无限增长的情况。内存使用量在处理请求期间会有合理波动，但总能回落到正常水平，证明了解决方案的有效性。

总结

内存管理是深度学习应用部署中的常见挑战。通过合理配置环境参数，我们可以在保证功能完整性的同时，有效控制资源消耗。这个案例也提醒我们，在生产环境中部署AI模型时，除了关注算法精度，还需要特别重视系统的资源管理和稳定性。

doctr

docTR (Document Text Recognition) - a seamless, high-performing & accessible library for OCR-related tasks powered by Deep Learning.

项目地址：https://gitcode.com/gh_mirrors/do/doctr

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

142

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解