首页
/ Tesseract 中文识别训练数据包

Tesseract 中文识别训练数据包

2026-01-31 04:44:12作者:翟萌耘Ralph

此仓库提供了已经经过中文识别训练的Tesseract OCR引擎的chi_sim.traineddata中文包,该数据包能够使得Tesseract对中文的识别效果更加准确。

文件说明

  • chi_sim.traineddata4.0中文包.zip:包含最新版本的中文训练数据,适用于Tesseract OCR引擎,以提升其对中国汉字的识别能力。

使用说明

将下载的chi_sim.traineddata文件解压,并根据Tesseract的安装指南将其放置到正确的目录下,以供OCR引擎调用。

注意事项

  • 请确保使用与训练数据版本相匹配的Tesseract OCR引擎版本,以获得最佳效果。
  • 使用此训练数据包应遵循Tesseract的相应使用条款和许可协议。
登录后查看全文
热门项目推荐
相关项目推荐