告别混乱翻译记录:LunaTranslator多格式导出全攻略
你是否还在为Galgame翻译文本的整理发愁?手动复制粘贴到记事本导致格式错乱,想统计台词频率却困于无法解析的文本?LunaTranslator提供从TXT到JSON的全流程导出方案,让翻译记录管理效率提升10倍。本文将详解3种核心导出格式的使用场景与实操技巧,附带配置文件路径与代码示例。
为什么需要专业文本导出功能?
Galgame翻译过程中,文本记录往往面临三大痛点:
- 碎片化管理:分散在剪贴板、截图和临时文件中的翻译内容难以追溯
- 多场景适配:同人创作需要纯文本,数据分析依赖结构化格式,二次编辑则需要表格
- 协作与存档:团队翻译时缺乏标准化的文本交换格式
LunaTranslator通过模块化输出架构解决这些问题,其核心实现位于src/LunaTranslator/textio/textoutput/目录,包含基础接口outputerbase.py与多种导出实现类。
三种核心导出格式全解析
JSON格式:结构化数据的最佳选择
JSON格式凭借其层级结构优势,成为存储对话树和多语言对照的理想方案。在src/trans_lang.py中,我们可以看到LunaTranslator如何使用标准JSON库实现语言文件导出:
with open(f"./files/lang/{kk}", "w", encoding="utf8") as ff:
ff.write(json.dumps(jsen, ensure_ascii=False, sort_keys=False, indent=4))
适用场景:
- 游戏MOD开发中的文本替换包
- 多语言对照数据库构建
- 配合脚本进行翻译质量分析
配置路径:全局配置文件defaultconfig/config.json中可设置JSON缩进字符数与编码格式。
TXT纯文本:轻量阅读与快速分享
对于只需保留对话顺序的场景,TXT格式提供最广泛的兼容性。虽然当前未直接发现TXT导出器实现,但通过clipboard.py的剪贴板输出功能,可间接实现文本捕获:
if (isorigin and self.config["origin"]) or ((not isorigin) and self.config["trans"]):
NativeUtils.ClipBoard.text = text
实操技巧:
- 在设置界面勾选"翻译后自动复制"
- 使用快捷键Ctrl+Shift+V粘贴到预设模板文件
- 配合正则表达式批量处理换行与缩进
模板文件:可参考docs/zh/emugames_template.md的文本组织方式。
WebSocket实时输出:多人协作新范式
对于直播翻译或团队协作场景,WebSocket输出提供毫秒级文本同步能力。websocket.py实现了基于WebSocket的实时广播:
def dispatch(self, text: str, isorigin: bool):
def __(handle):
if isorigin and isinstance(handle, TextOutputOrigin):
handle.send_text(text)
elif (not isorigin) and isinstance(handle, TextOutputTrans):
handle.send_text(text)
WSForEach(wsoutputsave, __)
部署方案:
- 启动内置WebSocket服务
- 在servicecollection.py中配置连接密码
- 使用支持WS协议的客户端工具接收(如wscat)
高级应用:自定义导出流程
通过扩展文本输出器基类,开发者可以实现专属导出格式。基础接口定义在outputerbase.py中:
class Base:
def dispatch(self, text: str, isorigin: bool):
pass # 需子类实现具体导出逻辑
def puttask(self, text, isorigin):
if not self.using:
return
self.queue.put((text, isorigin))
开发建议:
- 继承Base类实现Excel导出(可使用openpyxl库)
- 通过queue机制避免导出操作阻塞翻译主线程
- 在gui/setting/textinput.py中添加配置界面
最佳实践与常见问题
格式选择决策指南
| 格式 | 优势 | 适用场景 | 工具支持 |
|---|---|---|---|
| JSON | 结构化存储,支持嵌套 | 程序处理,多语言包 | 所有JSON解析器 |
| TXT | 轻量通用,兼容性好 | 阅读存档,简单分享 | 所有文本编辑器 |
| WS | 实时传输,多端同步 | 直播翻译,团队协作 | WebSocket客户端 |
性能优化技巧
当处理超过10万行的大型文本导出时,建议:
- 关闭config.json中的
indent参数减少JSON体积 - 使用transoptimi/目录下的文本压缩工具
- 分段导出避免内存占用过高
总结与展望
LunaTranslator通过模块化设计提供了灵活的文本导出解决方案,从基础的剪贴板输出到高级的WebSocket实时同步,覆盖了单机到团队的全场景需求。核心实现代码分布在:
- 导出接口:textio/textoutput/
- 格式处理:trans_lang.py
- 配置管理:defaultconfig/
未来版本计划加入Markdown表格导出和AI辅助排版功能,你可以通过docs/zh/gooduse/multiconfigs.md了解多配置管理技巧,或在项目Issues中提交功能建议。
提示:定期备份导出文件至docs/zh/目录下的归档文件夹,配合版本控制工具可实现翻译进度回溯。
收藏本文档,下次遇到翻译文本管理难题时,即可快速找到对应解决方案。关注项目更新,获取Excel导出功能的第一手教程!
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00