SakuraLLM:专为ACGN领域打造的日中翻译大模型
SakuraLLM是一款专门针对ACGN(动画、漫画、游戏、轻小说)领域开发的开源翻译模型,能够精准地进行日语到中文的轻小说和Galgame翻译。该项目基于一系列开源大模型构建,在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调,旨在提供开源可控可离线自部署的、ACGN风格的日中翻译模型。
技术特性与优势
SakuraLLM采用了先进的语言模型技术,充分利用了Qwen模型系列的知识,特别是最新版本Qwen1.5和Qwen2.5的成果。通过持续的预训练和专门针对轻小说和Galgame领域的微调,模型在以下方面表现出色:
- 人称代词准确性:能够联系上下文正确使用人称代词,不擅自添加原文中没有的代词
- 领域专业性:专门针对轻小说和Galgame文风进行优化,保持原作的风格特点
- 术语一致性:支持GPT字典功能,保持专有名词和人称的一致性
- 格式保留能力:对控制符、行内换行等特殊符号具有较好的保留能力
模型版本与规格
SakuraLLM提供了多个不同规模的模型版本,满足不同硬件需求:
- Sakura-14B-Qwen2.5-v1.0:14B参数规模,推荐11G-16G显存
- Sakura-7B-Qwen2.5-v1.0:7B参数规模,推荐8G-10G显存
- Sakura-1.5B-Qwen2.5-v1.0:1.5B参数规模,适合资源受限环境
所有模型均采用CC BY-NC-SA 4.0协议,仅供学习交流使用,禁止任何形式的商用。
应用场景
SakuraLLM在多个ACGN相关场景中都有出色表现:
轻小说翻译
能够流畅地将日文轻小说翻译成简体中文,保持原有的文学风格和表达方式。模型特别擅长处理轻小说中常见的第一人称叙述、对话场景和情感表达。
Galgame实时翻译
通过与LunaTranslator等工具集成,可以实现Galgame的实时翻译,让玩家能够无障碍体验全语音的日系游戏。
视觉小说翻译
专门的Galtransl版本针对视觉小说脚本中的行内换行、控制符、ruby注音等符号具有较好的保留能力,适合制作内嵌式翻译补丁。
部署与使用
SakuraLLM支持多种推理引擎,满足不同部署需求:
llama.cpp部署
支持GGUF量化模型,可以在各种硬件环境下运行:
python server.py --model_name_or_path ./models/sakura-14b-qwen2.5-v1.0.gguf --llama_cpp --use_gpu --model_version 1.0 --no-auth
vLLM部署
支持全量模型和量化模型,适合多GPU环境:
python server.py --model_name_or_path SakuraLLM/Sakura-14B-Qwen2.5-v1.0 --vllm --model_version 1.0 --tensor_parallel_size 2 --no-auth
Ollama部署
使用Docker容器化部署,安装运行简便:
python server.py --model_name_or_path onekuma/sakura-14b-qwen2.5-v1.0 --ollama --model_version 1.0 --no-auth
生态系统集成
SakuraLLM已经与多个流行的ACGN翻译工具集成:
- LunaTranslator:支持Galgame实时翻译,可通过本地API后端配置
- GalTransl:用于制作Galgame内嵌式翻译补丁
- AiNiee:RPG游戏翻译工具集成
- 轻小说机翻机器人:在线轻小说翻译平台
技术实现细节
模型采用先进的提示词格式,支持术语表功能:
gpt_dict = [{
"src": "原文",
"dst": "译文",
"info": "注释信息"
}]
推理参数经过精心调优:
- Temperature: 0.1
- Top p: 0.3
- Max new tokens: 512
- Repetition penalty: 1
项目特点
- 开源可控:遵循CC BY-NC-SA 4.0协议,确保透明度和自由度
- 高效兼容:适应各种使用场景,支持在线API服务和离线部署
- 专属性强:针对ACGN领域定制,准确理解并翻译特定领域文本
- 持续进化:不断更新升级,为用户提供最佳的翻译效果
SakuraLLM为ACGN爱好者提供了一个强大的翻译工具,帮助打破语言壁垒,让更多人能够享受日本轻小说和Galgame的魅力。无论是个人阅读还是内容创作,都能从中获得极大的便利。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0198
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0129
MiMo-V2.5-Pro-FP4-DFlashMiMo-V2.5-Pro-FP4-DFlash 是驱动 MiMo-V2.5-Pro-UltraSpeed 的底层模型: FP4 量化骨干网络:对 MoE 专家采用 MXFP4 量化,同时保持模型其他部分的更高精度,在几乎无损质量的前提下,显著减小模型体积并降低内存带宽压力。 BF16 DFlash 草稿生成器:用于块扩散推测解码,每次前向传播可生成一整个块的 tokens,并让骨干网络一步完成验证。 两者协同作用,既降低了每参数的位宽,又减少了骨干网络前向传播的次数,而这两者正是万亿参数模型解码过程中的两大主要成本来源。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
AstrBot✨ 易上手的多平台 LLM 聊天机器人及开发框架 ✨ 平台支持 QQ、QQ频道、Telegram、微信、企微、飞书 | OpenAI、DeepSeek、Gemini、硅基流动、月之暗面、Ollama、OneAPI、Dify 等。附带 WebUI。Python08
handy-ollama动手学Ollama,CPU玩转大模型部署,在线阅读地址:https://datawhalechina.github.io/handy-ollama/Jupyter Notebook07