DS4SD/docling项目中模型路径规范化的思考与实践

2025-05-06 18:58:14作者：何将鹤

在DS4SD/docling项目的实际应用中，模型文件的路径管理是一个值得关注的技术细节。本文将从项目实践的角度，分析当前模型路径管理存在的问题，并提出可行的改进方案。

当前路径管理的问题

在DS4SD/docling项目中，不同类型的模型采用了不同的路径管理策略：

布局模型和Tableformer模型
这两种模型采用了统一的结构化管理方式，路径格式为：
{artifacts_path}/model_artifacts/{model_type}/...
例如设置artifacts_path="models"时，实际路径为：
- 布局模型：models/model_artifacts/layout/...
- Tableformer模型：models/model_artifacts/tableformer/...
图片分类器模型
相比之下，图片分类器模型采用了不同的路径策略，要求所有模型文件直接存放在根目录下：
- {artifacts_path}/config.json
- {artifacts_path}/model.safetensors

这种不一致的路径管理方式带来了几个实际问题：

项目结构混乱，不利于统一管理
当同时使用图片分类器和其他模型时，路径配置会产生冲突
不符合开发者的直觉预期，增加了使用复杂度

改进方案分析

针对上述问题，可以考虑以下两种改进方案：

方案一：统一采用HuggingFace风格路径

此方案建议保持与HuggingFace模型库一致的目录结构：

models/
└── ds4sd/
    └── DocumentFigureClassifier/
        ├── config.json
        └── model.safetensors

实现方式是在初始化时指定artifacts_path为根目录，代码示例如下：

DocumentFigureClassifierPredictor(
    artifacts_path="models",  # 模型文件位于models/ds4sd/DocumentFigureClassifier
    device="cpu",
    num_threads=4,
)

优点：

与HuggingFace生态保持一致
便于模型版本管理
结构清晰，易于理解

方案二：采用项目统一路径结构

此方案建议采用与项目其他模型一致的目录结构：

models/
└── model_artifacts/
    └── DocumentFigureClassifier/
        ├── config.json
        └── model.safetensors

代码示例如下：

DocumentFigureClassifierPredictor(
    artifacts_path="models",  # 模型文件位于models/model_artifacts/DocumentFigureClassifier
    device="cpu",
    num_threads=4,
)

优点：