【亲测免费】 olmOCR 安装与配置指南

2026-01-30 04:44:34作者：盛欣凯Ernestine

1. 项目基础介绍

olmOCR 是由 AllenNLP 团队开发的一个开源项目，它是一个用于训练语言模型以处理野外的 PDF 文档的工具包。该项目主要使用 Python 编程语言实现，它提供了一系列工具来帮助语言模型更好地理解和解析自然文本。

在开始安装 olmOCR 之前，请确保您的系统满足以下要求：

安装依赖

接下来，安装 olmOCR 需要的依赖：

sudo apt-get install poppler-utils ttf-mscorefonts-installer msttcorefonts fonts-crosextra-caladea fonts-crosextra-carlito gsfonts lcdf-typetools

创建 Python 虚拟环境

olmOCR 需要一个独立的 Python 虚拟环境，可以使用以下命令创建：
```
conda create -n olmocr python=3.11
conda activate olmocr
```

克隆项目仓库

从 GitHub 克隆 olmOCR 项目仓库：

git clone https://github.com/allenai/olmocr.git
cd olmocr

安装项目依赖

使用 pip 安装项目所需的依赖：

pip install -e .[gpu] --find-links https://flashinfer.ai/whl/cu124/torch2.4/flashinfer/

完成以上步骤后，您已经成功安装了 olmOCR。接下来，可以按照项目文档中的示例进行本地使用或通过 web demo 进行快速测试。

登录后查看全文