Magic-PDF配置文件详解：MinerU项目核心配置解析

2025-05-04 12:11:40作者：瞿蔚英Wynne

Magic-PDF作为MinerU项目中的重要组件，其配置文件是控制PDF处理流程的核心部分。本文将全面解析配置文件中各项参数的技术含义和使用场景，帮助开发者更好地理解和定制PDF处理流程。

配置文件结构概述

Magic-PDF的配置文件采用JSON格式，主要包含以下几个核心模块：

存储桶配置(bucket_info)
模型路径配置(models-dir/layoutreader-model-dir)
设备模式(device-mode)
布局识别配置(layout-config)
公式识别配置(formula-config)
表格识别配置(table-config)
大模型辅助配置(llm-aided-config)
配置版本(config_version)

详细配置解析

1. 存储桶配置(bucket_info)

存储桶配置用于定义PDF处理过程中需要访问的云存储服务信息。每个存储桶需要配置三个关键参数：

bucket-name：自定义的存储桶名称
ak：Access Key ID，用于身份验证
sk：Secret Access Key，用于加密签名
endpoint：存储服务的访问端点

"bucket_info":{
    "bucket-name-1":["ak", "sk", "endpoint"],
    "bucket-name-2":["ak", "sk", "endpoint"]
}

2. 模型路径配置

模型路径配置指定了各类模型文件的存储位置：

models-dir：基础模型目录路径
layoutreader-model-dir：布局识别模型专用目录路径

"models-dir":"/opt/models",
"layoutreader-model-dir":"/opt/layoutreader"

3. 设备模式(device-mode)

设备模式决定了模型运行的硬件环境：

"cpu"：使用CPU进行计算
"cuda"：使用NVIDIA GPU加速（推荐配置）

"device-mode":"cuda"

4. 布局识别配置(layout-config)

控制PDF文档的版面分析功能：

model：指定使用的版面分析模型，当前支持"doclayout_yolo"

"layout-config": {
    "model": "doclayout_yolo"
}

5. 公式识别配置(formula-config)

配置数学公式的检测和识别功能：

mfd_model：公式检测模型，当前为"yolo_v8_mfd"
mfr_model：公式识别模型，当前为"unimernet_small"
enable：是否启用公式识别功能

"formula-config": {
    "mfd_model": "yolo_v8_mfd",
    "mfr_model": "unimernet_small",
    "enable": true
}

6. 表格识别配置(table-config)

配置表格识别相关参数：

model：主表格识别模型，当前为"rapid_table"
sub_model：辅助模型，当前为"slanet_plus"
enable：是否启用表格识别
max_time：单张表格处理的最大时间限制(毫秒)

"table-config": {
    "model": "rapid_table",
    "sub_model": "slanet_plus",
    "enable": true,
    "max_time": 400
}

7. 大模型辅助配置(llm-aided-config)

配置大语言模型辅助功能，包含三个子模块：

公式辅助(formula_aided)
- 使用大模型优化公式识别结果
- 需要配置API密钥、基础URL和模型名称
文本辅助(text_aided)
- 使用大模型优化文本内容
- 配置参数与公式辅助类似
标题辅助(title_aided)
- 使用大模型优化标题识别
- 支持更大规模的模型(如32B参数)

"llm-aided-config": {
    "formula_aided": {
        "api_key": "your_api_key",
        "base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
        "model": "qwen2.5-7b-instruct",
        "enable": false
    },
    "text_aided": {
        "api_key": "your_api_key",
        "base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
        "model": "qwen2.5-7b-instruct",
        "enable": false
    },
    "title_aided": {
        "api_key": "xxx",
        "base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
        "model": "qwen2.5-32b-instruct",
        "enable": true
    }
}