PolyglotPDF：高效PDF多语言转换工具使用指南

2026-02-06 05:27:38作者：廉彬冶Miranda

(eBook，PDFs Translation) A multilingual eBook processing tool supporting all eBook formats. Features online and offline translation while preserving original layouts. Compatible with both scanned and digital PDFs. Elegant user interface. The world's highest-performing open-source layout-preserving eBook translator.

项目地址：https://gitcode.com/gh_mirrors/po/PolyglotPDF

PolyglotPDF是一款革命性的PDF处理工具，它采用先进技术实现对PDF文档中文本、表格和公式的超快速识别，通常只需1秒即可完成处理。该工具具备OCR功能，能够完美保留原始文档格式进行翻译，全文档翻译通常在10秒内完成。

核心功能特性

超快速处理能力

文本识别：在约1秒内完成PDF中文字、表格和公式的处理
保留版面翻译：翻译过程中完整保持原文档的排版格式
OCR支持：高效处理扫描版文档，提升文本识别准确性
灵活API集成：支持多种翻译服务提供商，包括Doubao、Deepseek、Qwen、GPT-4o-mini等主流AI模型

多格式兼容性

基于文本的PDF：无需GPU即可处理
快速翻译：约10秒内完成整个PDF的翻译
网页对比界面：支持原文与译文的并排对比显示

快速安装指南

标准安装方式

首先克隆项目仓库：

git clone https://gitcode.com/gh_mirrors/po/PolyglotPDF.git
cd PolyglotPDF

安装所需依赖包：

pip install -r requirements.txt

配置API密钥，在config.json文件中填写相应的认证信息：

{
  "translation_services": {
    "AI302": {
      "auth_key": "您的API密钥",
      "model_name": "gpt-4o-mini"
}

运行应用程序：

python app.py

访问网页界面：在浏览器中打开 http://127.0.0.1:8000

Docker安装方式

使用Docker快速部署：

docker pull 2207397265/polyglotpdf:latest
docker run -d -p 12226:12226 --name polyglotpdf 2207397265/polyglotpdf:latest

访问应用：在浏览器中打开 http://localhost:12226

配置说明

主要配置项

在config.json文件中，您可以配置以下重要参数：

count：并发处理数量
PPC：每页字符数限制
translation_services：支持多种翻译API服务
ocr_services：OCR服务配置
default_services：默认服务设置

翻译服务配置示例

{
  "translation_services": {
    "AI302": {
      "auth_key": "您的API密钥",
      "model_name": "gpt-4o-mini"
}

使用教程

基础使用方法

通过命令行直接使用：

EbookTranslator your_file.pdf

高级参数配置

EbookTranslator document.pdf -o en -t zh -b 1 -e 10 -c config.json -d 300

Python代码集成

from EbookTranslator import main_function

translator = main_function(
    pdf_path="document.pdf",
    original_language="en",
    target_language="zh",
    bn=1,
    en=10,
    config_path="config.json",
    DPI=300
)
translator.main()

实际应用案例

技术文档翻译

将英文技术手册转换为中文版本，完整保留原始排版和图表位置，确保技术术语的准确翻译。

学术论文处理

快速翻译科研论文，保持数学公式和特殊符号的准确性，便于国际学术交流。

多语言文档对比

PolyglotPDF提供直观的网页界面，支持原文与翻译结果的并排对比：

技术原理

核心处理流程

项目基于PyMuPDF进行PDF解析和编辑，采用以下处理方式：

# 获取页面中的文本块
blocks = page.get_text("dict")["blocks"]

# 遍历处理每个文本块
for block in blocks:
    if block.get("type") == 0:  # 文本块
        bbox = block["bbox"]     # 获取文本块边界框
        text = ""
        # 收集文本和字体信息
        for line in block["lines"]:
            for span in line["spans"]:
                text += span["text"] + " "

这种方式直接处理PDF文本块，保持原有布局不变，实现高效的文本提取和修改。

性能优化策略

避免复杂AI处理：不进行AI识别公式、表格或页面重组等复杂操作
专注于文本处理：采用最优性能价格比的技术方案
低计算资源消耗：适合大规模部署和商业应用

常见问题解决

色彩空间问题

当遇到不支持的色彩空间时，系统会自动跳过该文本块，确保处理流程的顺利进行。

字体配置优化

您可以通过修改CSS样式来自定义字体显示效果：

css=f"""* {{
    font-family: {get_font_by_language(self.target_language)};
    font-size: auto;
    color: #111111;
    font-weight: normal;
    letter-spacing: 0.5px;
    line-height: 1.5;
}}"""

最佳实践建议

预先配置API密钥：在config.json中设置好翻译API的认证信息
选择合适的翻译模型：根据文档类型选择最合适的AI翻译模型
测试不同DPI设置：根据文档质量调整DPI参数以获得最佳效果

生态系统集成

PolyglotPDF集成了先进的OCR引擎和多种翻译服务，提供完整的PDF处理解决方案。

通过掌握这些使用技巧，您将能够充分发挥PolyglotPDF的强大功能，轻松应对各种多语言文档处理需求。无论是商务文档、技术手册还是学术论文，PolyglotPDF都能为您提供高效、准确的翻译服务。

PolyglotPDF

项目地址：https://gitcode.com/gh_mirrors/po/PolyglotPDF

登录后查看全文

PolyglotPDF：高效PDF多语言转换工具使用指南

核心功能特性

超快速处理能力

多格式兼容性

快速安装指南

标准安装方式

Docker安装方式

配置说明

主要配置项

翻译服务配置示例

使用教程

基础使用方法

高级参数配置

Python代码集成

实际应用案例

技术文档翻译

学术论文处理

多语言文档对比

技术原理

核心处理流程

性能优化策略

常见问题解决

色彩空间问题

字体配置优化

最佳实践建议

生态系统集成

热门内容推荐

最新内容推荐

项目优选

PolyglotPDF：高效PDF多语言转换工具使用指南

核心功能特性

超快速处理能力

多格式兼容性

快速安装指南

标准安装方式

Docker安装方式

配置说明

主要配置项

翻译服务配置示例

使用教程

基础使用方法

高级参数配置

Python代码集成

实际应用案例

技术文档翻译

学术论文处理

多语言文档对比

技术原理

核心处理流程

性能优化策略

常见问题解决

色彩空间问题

字体配置优化

最佳实践建议

生态系统集成

相关内容推荐

热门内容推荐

最新内容推荐

项目优选