Tesseract OCR 安装和配置指南

2026-01-20 02:19:18作者：裘旻烁

1. 项目基础介绍和主要编程语言

项目基础介绍

Tesseract OCR 是一个开源的光学字符识别（OCR）引擎，最初由惠普实验室开发，后来在2005年被开源。Tesseract 4 引入了基于神经网络（LSTM）的新 OCR 引擎，专注于行识别，同时也支持 Tesseract 3 的旧版 OCR 引擎。Tesseract 支持多种语言的识别，并且可以处理多种图像格式，如 PNG、JPEG 和 TIFF。

主要编程语言

Tesseract 主要使用 C++ 编写，但也包含一些 Java 和 Shell 脚本。

2. 项目使用的关键技术和框架

关键技术

LSTM（长短期记忆网络）：Tesseract 4 使用 LSTM 进行字符识别，提高了识别准确率。
Leptonica：一个图像处理库，Tesseract 使用它来处理输入图像。

框架

CMake：用于构建 Tesseract 的跨平台构建系统。
Doxygen：用于生成 Tesseract 的源代码文档。

3. 项目安装和配置的准备工作和详细安装步骤

准备工作

在开始安装之前，请确保您的系统满足以下要求：

支持的编译器（如 GCC 或 Clang）
CMake 3.1 或更高版本
Leptonica 库

详细安装步骤

步骤 1：安装依赖库

首先，您需要安装 Leptonica 库。在大多数 Linux 发行版中，可以使用包管理器安装：

sudo apt-get install libleptonica-dev

步骤 2：克隆 Tesseract 仓库

使用 Git 克隆 Tesseract 的 GitHub 仓库：

git clone https://github.com/UB-Mannheim/tesseract.git
cd tesseract

步骤 3：配置和构建 Tesseract

使用 CMake 配置和构建 Tesseract：

mkdir build
cd build
cmake ..
make

步骤 4：安装 Tesseract

构建完成后，安装 Tesseract：

sudo make install

步骤 5：验证安装

安装完成后，您可以通过运行以下命令来验证 Tesseract 是否正确安装：

tesseract --version

如果安装成功，您将看到 Tesseract 的版本信息。

配置

Tesseract 的配置文件通常位于 /usr/local/share/tessdata 目录下。您可以下载所需的语言数据文件并放置在该目录中。例如，下载英文数据文件：

wget https://github.com/tesseract-ocr/tessdata/raw/main/eng.traineddata
sudo mv eng.traineddata /usr/local/share/tessdata/

使用示例

以下是一个简单的使用示例，识别一张图片中的文本：

tesseract image.png output -l eng

这将生成一个名为 output.txt 的文件，其中包含识别出的文本。

通过以上步骤，您应该能够成功安装和配置 Tesseract OCR，并开始使用它进行文本识别。

tesseract

Tesseract Open Source OCR Engine (main repository)

项目地址：https://gitcode.com/gh_mirrors/tes/tesseract

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Dora SSR 是一款跨平台的游戏引擎，提供前沿或是具有探索性的游戏开发功能。它内置了Web IDE，提供了可以轻轻松松通过浏览器访问的快捷游戏开发环境，特别适合于在新兴市场如国产游戏掌机和其它移动电子设备上直接进行游戏开发和编程学习。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.36 K

772