Text-Extract-API项目GPU加速配置问题分析与解决方案

2025-06-30 06:57:02作者：庞眉杨Will

Document (PDF, Word, PPTX ...) extraction and parse API using state of the art modern OCRs + Ollama supported models. Anonymize documents. Remove PII. Convert any document or picture to structured JSON or Markdown

项目地址：https://gitcode.com/gh_mirrors/te/text-extract-api

问题背景

在Text-Extract-API项目中，用户在使用Docker容器部署服务时遇到了GPU未被正确识别和使用的问题。该项目是一个基于FastAPI的文本提取服务，支持OCR和LLM功能，预期能够利用GPU加速处理过程。

问题现象

用户在使用docker-compose.gpu.yml配置文件启动服务时，发现以下异常情况：

虽然主机环境中Ollama可以正常使用GPU运行llama3.2-vision模型
但在Docker容器中GPU未被识别，日志显示"no compatible GPUs were discovered"
在容器内执行nvidia-smi命令失败，提示命令不存在

技术分析

根本原因

经过深入分析，发现问题的核心在于Docker容器的GPU支持配置不完整。具体表现为：

docker-compose.gpu.yml文件中缺少必要的NVIDIA运行时配置
容器内未正确安装NVIDIA驱动工具包
CUDA环境变量可能未正确传递

解决方案

针对上述问题，需要从以下几个方面进行修复：

在docker-compose.gpu.yml中明确指定runtime为nvidia
确保容器内安装了必要的NVIDIA工具包
正确配置CUDA相关的环境变量

具体实现

正确的docker-compose.gpu.yml配置应包含以下关键部分：

services:
  celery_worker:
    runtime: nvidia
    environment:
      - NVIDIA_VISIBLE_DEVICES=all
      - NVIDIA_DRIVER_CAPABILITIES=compute,utility

同时，Dockerfile.gpu中应确保安装了必要的工具：

RUN apt-get update && apt-get install -y --no-install-recommends \
    nvidia-cuda-toolkit \
    nvidia-utils-535

验证方法

部署后可通过以下方式验证GPU是否正常工作：

进入容器执行nvidia-smi命令，应能显示GPU状态
检查服务日志，确认GPU被正确识别
观察任务处理速度，确认GPU加速生效

总结

Text-Extract-API项目在使用GPU加速时，需要特别注意Docker环境的完整配置。通过正确设置runtime和环境变量，并确保容器内安装了必要的驱动工具，可以解决GPU未被识别的问题。这一解决方案不仅适用于本项目，对于其他需要GPU加速的Docker化应用也具有参考价值。

text-extract-api

项目地址：https://gitcode.com/gh_mirrors/te/text-extract-api

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch