首页
/ OCRmyPDF与Ghostscript 10.03.1版本兼容性问题分析

OCRmyPDF与Ghostscript 10.03.1版本兼容性问题分析

2025-05-06 00:00:36作者:庞队千Virginia

在文档数字化处理领域,OCRmyPDF作为一款优秀的开源工具,能够将扫描的PDF文档转换为可搜索的PDF文件。然而,近期随着Ghostscript升级到10.03.1版本,用户在使用OCRmyPDF时遇到了一个关键的兼容性问题。

问题本质

核心问题在于OCRmyPDF与新版Ghostscript交互时,文件参数传递顺序出现了错误。当用户尝试生成PDF/A格式(一种长期存档的PDF标准)时,OCRmyPDF错误地将PDFA定义文件放在了输入文件之后传递给Ghostscript,而Ghostscript 10.03.1版本对此顺序要求更为严格。

技术细节

根据Ghostscript官方文档,创建PDF/A文档的正确命令格式应该是:

gs -dPDFA=1 -dBATCH -dNOPAUSE -sColorConversionStrategy=RGB -sDEVICE=pdfwrite -sOutputFile=out-a.pdf PDFA_def.ps input.ps

关键点在于PDFA定义文件(PDFA_def.ps)必须位于输入文件之前。然而当前OCRmyPDF 13.4.0版本生成的命令却是:

gs [...] /tmp/fix_docinfo.pdf /tmp/pdfa.ps

这种错误的顺序导致Ghostscript无法在需要时获取PDF/A的配置信息,最终引发"rangecheck in .putdeviceprops"错误。

临时解决方案

目前用户可以通过以下两种方式暂时规避此问题:

  1. 强制指定输出类型为标准PDF而非PDF/A:

    ocrmypdf --output-type pdf input.pdf output.pdf
    
  2. 降级Ghostscript到10.03.1之前的版本

影响范围

此问题主要影响:

  • 使用Ghostscript 10.03.1版本的用户
  • 需要生成PDF/A格式输出的场景
  • OCRmyPDF 13.4.0及可能更早版本

技术建议

对于开发者而言,修复此问题需要调整OCRmyPDF中生成Ghostscript命令的代码逻辑,确保PDFA定义文件参数始终位于输入文件之前。同时,这也提醒我们在处理外部依赖升级时,需要密切关注其参数规范的变化。

对于终端用户,建议关注OCRmyPDF的后续更新,官方很可能会发布针对此问题的修复版本。在此期间,使用上述临时解决方案可以保证基本功能的正常使用。

登录后查看全文

项目优选

收起
kernelkernel
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
466
kernelkernel
deepin linux kernel
C
32
16
atomcodeatomcode
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started
Rust
2.09 K
218
ops-nnops-nn
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
700
1.4 K
docsdocs
暂无描述
Dockerfile
780
5.08 K
pytorchpytorch
Ascend Extension for PyTorch
Python
758
968
flutter_flutterflutter_flutter
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
272
ops-transformerops-transformer
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
880
2.02 K
mindquantummindquantum
MindQuantum is a general software library supporting the development of applications for quantum computation.
Python
183
112
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.11 K
682