MinerU实战指南：从安装到部署完整教程

2026-02-04 04:49:22作者：冯爽妲Honey

引言：PDF解析的痛点与解决方案

还在为PDF文档的结构化解析而烦恼吗？面对复杂的学术论文、技术文档或商业报告，传统OCR工具往往无法准确识别版面结构、表格内容和数学公式，导致信息提取不完整、格式混乱等问题。

MinerU作为一款开源的高质量PDF解析工具，专门解决这些痛点。本文将为您提供从零开始的完整安装部署指南，帮助您快速掌握这一强大工具。

核心功能全景图

graph TD
    A[MinerU PDF解析工具] --> B[多后端架构]
    B --> C[pipeline后端]
    B --> D[VLM后端]
    
    C --> C1[传统OCR+AI分析]
    C --> C2[支持CPU推理]
    C --> C3[多语言识别]
    
    D --> D1[视觉语言模型]
    D --> D2[GPU加速]
    D --> D3[sglang加速]
    
    A --> E[输出格式]
    E --> E1[Markdown]
    E --> E2[JSON]
    E --> E3[中间格式]
    
    A --> F[特色功能]
    F --> F1[公式LaTeX转换]
    F --> F2[表格HTML解析]
    F --> F3[版面结构保留]
    F --> F4[多模态输出]

环境准备与系统要求

硬件要求

组件	最低配置	推荐配置
CPU	4核心	8核心以上
内存	16GB	32GB
显卡	集成显卡	NVIDIA Turing+架构，8GB显存
存储	20GB HDD	50GB SSD

软件要求

操作系统: Linux / Windows 10+ / macOS 12+
Python版本: 3.10 - 3.13
包管理器: pip 或 uv

四种安装方式详解

方式一：标准pip安装（推荐）

# 更新pip并安装uv包管理器
pip install --upgrade pip -i https://mirrors.aliyun.com/pypi/simple
pip install uv -i https://mirrors.aliyun.com/pypi/simple

# 安装MinerU核心功能包
uv pip install -U "mineru[core]" -i https://mirrors.aliyun.com/pypi/simple

方式二：源码编译安装

# 克隆项目代码
git clone https://gitcode.com/gh_mirrors/mi/MinerU.git
cd MinerU

# 使用uv安装开发版本
uv pip install -e .[core] -i https://mirrors.aliyun.com/pypi/simple

方式三：Docker容器化部署

# 下载Dockerfile
wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/docker/china/Dockerfile

# 构建Docker镜像
docker build -t mineru-sglang:latest -f Dockerfile .

# 启动容器（支持GPU）
docker run --gpus all \
  --shm-size 32g \
  -p 30000:30000 -p 7860:7860 -p 8000:8000 \
  --ipc=host \
  -it mineru-sglang:latest \
  /bin/bash

方式四：Docker Compose一键部署

# 下载compose配置文件
wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/docker/compose.yaml

# 启动sglang-server服务
docker compose -f compose.yaml --profile sglang-server up -d

# 启动Web API服务
docker compose -f compose.yaml --profile api up -d

# 启动Gradio WebUI
docker compose -f compose.yaml --profile gradio up -d

模型下载与配置

自动下载模型

# 使用默认huggingface源
mineru-models-download

# 或使用modelscope源（国内用户推荐）
export MINERU_MODEL_SOURCE=modelscope
mineru-models-download

模型源配置对比

模型源	访问速度	稳定性	适用地区
Huggingface	较慢	高	海外用户
Modelscope	快	高	国内用户
本地路径	最快	最高	离线环境

实战使用指南

基础命令行使用

# 最简单的解析命令
mineru -p input.pdf -o output_dir

# 指定VLM后端解析
mineru -p input.pdf -o output_dir -b vlm-transformers

# 批量处理目录中的所有PDF
mineru -p ./pdfs/ -o ./output/ -b pipeline

# 使用sglang-client连接远程服务器
mineru -p input.pdf -o output_dir -b vlm-sglang-client -u http://server_ip:30000

Python API集成示例

from mineru.utils.models_download_utils import auto_download_and_get_model_root_path
from mineru.demo.demo import parse_doc
from pathlib import Path

# 设置模型源（可选）
import os
os.environ['MINERU_MODEL_SOURCE'] = "modelscope"

# 自动下载模型
auto_download_and_get_model_root_path()

# 解析单个文档
pdf_path = Path("document.pdf")
output_dir = "./output_results"

parse_doc(
    path_list=[pdf_path],
    output_dir=output_dir,
    lang="ch",  # 语言选项：ch, en, japan, korean等
    backend="pipeline",  # 后端选择
    method="auto"  # 解析方法：auto, txt, ocr
)

高级参数配置

# 自定义输出选项
mineru -p input.pdf -o output_dir \
  --formula-enable true \      # 启用公式识别
  --table-enable true \        # 启用表格识别
  --lang ch \                  # 指定语言
  --start-page 0 \             # 起始页码
  --end-page 10 \              # 结束页码
  --make-mode MM_MD            # 输出模式

服务化部署方案

FastAPI服务部署

# 启动API服务
mineru-api --host 0.0.0.0 --port 8000

# 测试API接口
curl -X POST "http://localhost:8000/parse" \
  -F "file=@document.pdf" \
  -F "backend=pipeline"

Gradio Web界面部署

# 启动WebUI服务
mineru-gradio --server-name 0.0.0.0 --server-port 7860

# 带sglang引擎的WebUI
mineru-gradio --server-name 0.0.0.0 --server-port 7860 --enable-sglang-engine true

sglang服务器集群部署

# 启动sglang推理服务器
mineru-sglang-server --port 30000 --tokenizer-parallelism true

# 客户端连接配置
export SGLANG_SERVER_URL="http://192.168.1.100:30000"
export SGLANG_BACKEND="vlm-sglang-client"

性能优化指南

硬件加速配置

# CUDA加速配置（NVIDIA显卡）
export CUDA_VISIBLE_DEVICES=0  # 指定GPU设备

# MPS加速配置（Apple Silicon）
export PYTORCH_ENABLE_MPS_FALLBACK=1

# 内存优化配置
export OMP_NUM_THREADS=4       # 设置OpenMP线程数
export MKL_NUM_THREADS=4       # 设置MKL线程数

后端选择策略

场景	推荐后端	优势	资源需求
CPU环境	pipeline	兼容性好	内存16GB+
单GPU推理	vlm-transformers	精度高	显存8GB+
高性能需求	vlm-sglang-engine	速度快20-30倍	显存8GB+
分布式部署	vlm-sglang-client	资源分离	网络+CPU

常见问题解决方案

网络连接问题

# 使用国内镜像源
export MINERU_MODEL_SOURCE=modelscope
export HF_ENDPOINT=https://hf-mirror.com

# 代理配置
export HTTP_PROXY=http://proxy.example.com:8080
export HTTPS_PROXY=http://proxy.example.com:8080

模型下载失败

# 手动下载模型
wget https://modelscope.cn/api/v1/models/OpenDataLab/MinerU/repo?Revision=master

# 设置本地模型路径
export MINERU_MODEL_SOURCE=local
export MINERU_MODELS_DIR=/path/to/local/models

内存不足处理

# 减少批量处理大小
mineru -p input.pdf -o output_dir --batch-size 1

# 启用内存优化
export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:128

监控与维护

服务健康检查

# API服务健康检查
curl http://localhost:8000/health

# sglang服务状态
curl http://localhost:30000/v1/health

# 模型加载状态
mineru-models-download --check

日志监控配置

# 启用详细日志
export MINERU_LOG_LEVEL=DEBUG

# 日志文件轮转
export MINERU_LOG_ROTATION=100MB
export MINERU_LOG_RETENTION=7days

总结与展望

通过本指南，您已经掌握了MinerU从安装到部署的完整流程。无论是个人使用还是企业级部署，MinerU都能提供高质量的PDF解析服务。

关键收获：

掌握了4种不同的安装方式，适应各种环境需求
理解了多后端架构的优势和适用场景
学会了服务化部署和性能优化技巧
具备了故障排查和监控维护能力

下一步建议：

从pipeline后端开始，逐步尝试VLM后端的高性能特性
根据实际业务需求选择合适的部署方案
定期关注项目更新，获取最新功能和性能优化

MinerU作为开源项目正在快速发展，建议加入社区讨论，获取最新技术动态和最佳实践分享。

MinerU

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具，将PDF转换成Markdown和JSON格式。

项目地址：https://gitcode.com/GitHub_Trending/mi/MinerU

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

128

173

MinerU实战指南：从安装到部署完整教程

引言：PDF解析的痛点与解决方案

核心功能全景图

环境准备与系统要求

硬件要求

软件要求

四种安装方式详解

方式一：标准pip安装（推荐）

方式二：源码编译安装

方式三：Docker容器化部署

方式四：Docker Compose一键部署

模型下载与配置

自动下载模型

模型源配置对比

实战使用指南

基础命令行使用

Python API集成示例

高级参数配置

服务化部署方案

FastAPI服务部署

Gradio Web界面部署

sglang服务器集群部署

性能优化指南

硬件加速配置

后端选择策略

常见问题解决方案

网络连接问题

模型下载失败

内存不足处理

监控与维护

服务健康检查

日志监控配置

总结与展望

热门内容推荐

最新内容推荐

项目优选

MinerU实战指南：从安装到部署完整教程

引言：PDF解析的痛点与解决方案

核心功能全景图

环境准备与系统要求

硬件要求

软件要求

四种安装方式详解

方式一：标准pip安装（推荐）

方式二：源码编译安装

方式三：Docker容器化部署

方式四：Docker Compose一键部署

模型下载与配置

自动下载模型

模型源配置对比

实战使用指南

基础命令行使用

Python API集成示例

高级参数配置

服务化部署方案

FastAPI服务部署

Gradio Web界面部署

sglang服务器集群部署

性能优化指南

硬件加速配置

后端选择策略

常见问题解决方案

网络连接问题

模型下载失败

内存不足处理

监控与维护

服务健康检查

日志监控配置

总结与展望

相关内容推荐

热门内容推荐

最新内容推荐

项目优选