PaddleOCR-json 项目下载及安装教程

2024-12-07 14:59:24作者：滕妙奇

项目介绍

PaddleOCR-json 是一个基于 PaddleOCR 的离线图片文字识别程序，它以 JSON 字符串形式输出结果，方便其他程序调用。该项目提供了多种语言的 API，使得没有 C++ 编程基础的开发者也能通过简单的代码调用 OCR 功能。PaddleOCR-json 支持 Windows 和 Linux 系统，具有高速、精准和灵活的特点。

项目下载位置

PaddleOCR-json 项目的源代码托管在 GitHub 上。你可以通过以下步骤下载项目：

打开终端或命令提示符。
使用 git clone 命令下载项目：

git clone https://github.com/hiroi-sora/PaddleOCR-json.git

项目安装环境配置

在安装 PaddleOCR-json 之前，你需要确保系统满足以下环境要求：

操作系统：Windows 7 x64 或 Linux x64
CPU：必须支持 AVX 指令集（常见的家用 CPU 一般都满足该条件）
内存：建议预留 2000MB 内存

环境配置示例

以下是 Windows 系统上的环境配置示例：

检查 CPU 支持 AVX 指令集：
- 打开任务管理器，点击“性能”选项卡。
- 在“CPU”部分，查看“指令集”是否包含 AVX。
安装 Visual C++ 运行库：
- 如果系统提示缺少 VCOMP140.DLL，请下载并安装 Visual C++ 运行库。

项目安装方式

PaddleOCR-json 的安装非常简单，只需解压下载的文件并运行可执行文件即可。以下是详细步骤：

下载可执行文件包：
- 访问项目的 GitHub 页面，下载最新的发布版本。
解压文件：
- 将下载的压缩包解压到任意目录。
运行可执行文件：
- 在解压后的目录中找到 PaddleOCR-json.exe 文件，双击运行。

项目处理脚本

PaddleOCR-json 提供了多种语言的 API，以下是 Python 和 Node.js 的示例脚本：

Python 示例

from PPOCR_api import GetOcrApi

# 初始化识别器对象，传入 PaddleOCR-json.exe 的路径
ocr = GetOcrApi("path/to/PaddleOCR-json.exe")

# 识别图片，传入图片路径
getObj = ocr.run('path/to/test.png')
print(f'图片识别完毕，状态码：[{getObj["code"]}] 结果：\n{getObj["data"]}\n')

Node.js 示例

const OCR = require('paddleocrjson');

const ocr = new OCR('path/to/PaddleOCR-json.exe', [/* '-port=9985', '-addr=loopback' */], { cwd: 'path/to/PaddleOCR-json' }, false);

ocr.flush({ image_path: 'path/to/test/img' }).then((data) => {
    console.log(data);
}).then(() => {
    ocr.terminate();
});