MinerU 在 macOS 上的安装问题与解决方案

2026-02-04 05:24:03作者：丁柯新Fawn

问题概述

在 macOS 系统上安装 MinerU 2.0.2 版本时，用户遇到了依赖包 sgl-kernel 的平台兼容性问题。具体错误信息显示，由于 sgl-kernel==0.1.7 没有适用于 macosx_15_0_arm64 平台的预编译包（wheel），导致安装失败。

技术背景

MinerU 是一个基于 Python 的数据挖掘工具库，它依赖于多个第三方包。其中，sglang[all]==0.4.7 是一个关键依赖，而它又依赖于 sgl-kernel==0.1.7。sgl-kernel 是一个底层库，通常需要与操作系统和硬件架构兼容的预编译包才能正常安装。

在 macOS 上，特别是基于 ARM 架构的 Apple Silicon 设备（如 M1、M2、M3 芯片），Python 包的兼容性问题较为常见。许多包可能只提供了针对 x86_64 架构或特定 Linux 平台的预编译包，而没有为 macOS ARM 架构提供支持。

错误分析

安装失败的根本原因是 sgl-kernel 包没有提供适用于 macosx_15_0_arm64 平台的预编译包。错误提示指出，该包只提供了 manylinux2014_x86_64 平台的预编译包，这意味着它只能在 Linux 系统上运行。

这种平台不兼容的问题通常有以下几种原因：

包维护者没有为 macOS ARM 架构提供预编译包
包本身依赖于某些只能在特定平台上运行的底层库
包的构建系统没有配置为支持 macOS ARM 架构

解决方案

对于 macOS 用户，MinerU 提供了替代的安装方案。由于 sglang[all] 包在 macOS 上不可用，用户可以选择安装 mineru[core] 版本，它不包含那些与 macOS 不兼容的依赖项。

安装步骤

确保已安装合适的 Python 环境（建议使用 Python 3.8-3.12）
创建并激活虚拟环境（可选但推荐）
使用以下命令安装 MinerU 核心功能：

pip install mineru[core]

或者，如果使用 uv 作为包管理器：

uv pip install mineru[core]

功能差异

需要注意的是，mineru[core] 版本可能缺少某些高级功能，特别是那些依赖于 sglang 的功能。对于大多数基本数据挖掘任务，核心版本应该足够使用。如果需要完整功能，建议在 Linux 环境或使用 Docker 容器中安装 MinerU。

替代方案

如果必须在 macOS 上使用 MinerU 的完整功能，可以考虑以下替代方案：

使用 Docker：通过 Docker 容器运行 Linux 环境，从而避免平台兼容性问题
使用 Rosetta 2：在基于 Apple Silicon 的 Mac 上使用 Rosetta 2 运行 x86_64 版本的 Python
从源码编译：尝试从源码编译 sgl-kernel 包（如果可能）

总结

macOS 用户在使用 MinerU 时可能会遇到平台兼容性问题，特别是基于 ARM 架构的设备。通过安装 mineru[core] 版本，可以绕过不兼容的依赖项，获得基本功能。对于需要完整功能的用户，建议使用 Linux 环境或 Docker 容器。

这种平台兼容性问题是开源项目中常见的挑战，特别是在跨平台支持方面。作为用户，了解这些限制并选择合适的安装方式非常重要。同时，也可以考虑向相关包维护者反馈问题，促进更好的跨平台支持。

MinerU

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具，将PDF转换成Markdown和JSON格式。

项目地址：https://gitcode.com/OpenDataLab/MinerU

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781