BallonsTranslator项目中的文本检测模型更新与优化

2025-06-20 18:21:36作者：瞿蔚英Wynne

在开源项目BallonsTranslator中，文本检测模型是核心组件之一，负责从漫画图像中准确定位文本区域。近期项目团队对文本检测模型进行了重要更新，移除了旧版模型并推荐使用更高效的替代方案。

模型更新背景

项目原本使用的ysgyolo_v11_x.pt模型已被标记为过时版本。经过实际测试验证，开发团队发现该模型在多项指标上表现不佳，特别是在处理多行文本识别时准确率不足。这一问题不仅影响BallonsTranslator内置的OCR功能，在使用最新版PaddleOCR时同样存在识别精度问题。

技术优化方向

针对现有模型在多行文本识别上的不足，开发团队正在训练新一代检测模型，主要改进包括：

采用全标注单行文本训练策略
优化模型对复杂排版文本的识别能力
提升小文本区域的检测精度

这些改进将显著提升漫画翻译中气泡文本的识别准确率，特别是对于包含多行文本、特殊排版或小字号文本的情况。

用户升级建议

对于BallonsTranslator用户，建议尽快升级到最新推荐的文本检测模型。项目文档已提供详细的使用指南和模型下载说明。用户应注意检查自己的模型版本，避免继续使用已废弃的ysgyolo_v11_x.pt模型，以获得最佳的文字检测和识别体验。

BallonsTranslator

深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像/文本编辑 | Yet another computer-aided comic/manga translation tool powered by deeplearning

项目地址：https://gitcode.com/gh_mirrors/ba/BallonsTranslator

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

186

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

759

BallonsTranslator项目中的文本检测模型更新与优化

模型更新背景

推荐替代方案

技术优化方向

用户升级建议

项目优选