CnOCR项目使用指南：从安装到实战应用

2026-02-04 04:23:46作者：薛曦旖Francesca

CnOCR: Awesome Chinese/English OCR Python toolkits based on PyTorch. It comes with 20+ well-trained models for different application scenarios and can be used directly after installation. 【基于 PyTorch/MXNet 的中文/英文 OCR Python 包。】

项目地址：https://gitcode.com/gh_mirrors/cn/CnOCR

一、项目概述

CnOCR是一个基于深度学习的开源OCR（光学字符识别）工具，专注于中文场景下的文字识别任务。该项目由breezedeus开发维护，支持多种场景的文字识别，包括印刷体、手写体、竖排文字等，在中文OCR领域有着广泛的应用。

二、环境准备与模型下载

2.1 模型自动下载机制

首次使用CnOCR时，系统会自动下载预训练模型文件，存储路径如下：

Linux/Mac系统：~/.cnocr/2.3/
Windows系统：C:\Users\<username>\AppData\Roaming\cnocr\2.3\

模型文件为zip压缩包，下载后会自动解压。如果自动下载失败，用户需要手动获取模型文件并放置到上述目录中。

2.2 模型选择建议

CnOCR提供了多种预训练模型，用户可根据实际需求选择：

默认模型：densenet_lite_136-gru（识别）+ ch_PP-OCRv3_det（检测）
英文专用模型：en_PP-OCRv3（识别）+ en_PP-OCRv3_det（检测）
繁体中文模型：chinese_cht_PP-OCRv3

三、核心API详解

3.1 CnOCR类初始化

初始化CnOCR类时，可通过参数灵活配置模型和运行环境：

ocr = CnOcr(
    rec_model_name='densenet_lite_136-gru',  # 识别模型名称
    det_model_name='ch_PP-OCRv3_det',       # 检测模型名称
    cand_alphabet=None,                     # 限定识别字符集
    context='cpu',                          # 运行设备
    rec_model_backend='onnx',               # 识别模型后端
    det_model_backend='onnx'                # 检测模型后端
)

关键参数说明：

cand_alphabet：限定识别字符范围，如设置为"0123456789"则只识别数字
context：支持'cpu'、'gpu'、'cuda:0'等设备选项
*_backend：建议使用'onnx'以获得更快的推理速度

3.2 三大核心识别函数

3.2.1 通用识别：ocr()

适用于包含多行文字的复杂场景图片：

results = ocr.ocr('multi_line.png')

返回结果为列表，每个元素包含：

text：识别文本
score：置信度(0-1)
position：文本框坐标(4个顶点)
cropped_img：裁剪后的文本框图像(可选)

3.2.2 单行识别：ocr_for_single_line()

针对明确只有单行文字的图片：

result = ocr.ocr_for_single_line('single_line.png')

返回结果为字典，包含text和score两个字段。

3.2.3 批量单行识别：ocr_for_single_lines()

批量处理多个单行文字图片：

results = ocr.ocr_for_single_lines([img1, img2, img3])

四、实战应用场景

4.1 常见图文识别

ocr = CnOcr()
result = ocr.ocr('ticket.jpg')

适用于火车票、发票等常见文档的识别。

4.2 简单排版印刷体识别

使用naive_det检测模型提升速度：

ocr = CnOcr(det_model_name='naive_det')

适用于截图、扫描件等排版规范的文档。

4.3 竖排文字识别

ocr = CnOcr(rec_model_name='ch_PP-OCRv3')

4.4 纯英文识别

ocr = CnOcr(
    det_model_name='en_PP-OCRv3_det',
    rec_model_name='en_PP-OCRv3'
)

4.5 繁体中文识别

ocr = CnOcr(rec_model_name='chinese_cht_PP-OCRv3')

五、性能优化建议

模型后端选择：优先使用ONNX后端(速度比PyTorch快约2倍)
批量处理：对多行文本使用rec_batch_size参数
设备选择：GPU环境下设置context='gpu'
分辨率调整：通过resized_shape参数优化检测效果

六、常见问题处理

模型下载失败：手动下载模型并放置到指定目录
识别精度不足：
- 调整resized_shape参数
- 尝试不同的模型组合
- 使用cand_alphabet限定字符范围
特殊场景适配：考虑使用自定义训练模型

七、结语

CnOCR作为一款功能强大的中文OCR工具，通过灵活的API设计和丰富的预训练模型，能够满足大多数中文文字识别场景的需求。本文详细介绍了从环境准备到实际应用的完整流程，希望读者能够根据自身需求选择合适的配置方案，在实际应用中取得理想的识别效果。

CnOCR

项目地址：https://gitcode.com/gh_mirrors/cn/CnOCR

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Python

1.01 K

631