告别混乱翻译记录:LunaTranslator多格式导出全攻略
你是否还在为Galgame翻译文本的整理发愁?手动复制粘贴到记事本导致格式错乱,想统计台词频率却困于无法解析的文本?LunaTranslator提供从TXT到JSON的全流程导出方案,让翻译记录管理效率提升10倍。本文将详解3种核心导出格式的使用场景与实操技巧,附带配置文件路径与代码示例。
为什么需要专业文本导出功能?
Galgame翻译过程中,文本记录往往面临三大痛点:
- 碎片化管理:分散在剪贴板、截图和临时文件中的翻译内容难以追溯
- 多场景适配:同人创作需要纯文本,数据分析依赖结构化格式,二次编辑则需要表格
- 协作与存档:团队翻译时缺乏标准化的文本交换格式
LunaTranslator通过模块化输出架构解决这些问题,其核心实现位于src/LunaTranslator/textio/textoutput/目录,包含基础接口outputerbase.py与多种导出实现类。
三种核心导出格式全解析
JSON格式:结构化数据的最佳选择
JSON格式凭借其层级结构优势,成为存储对话树和多语言对照的理想方案。在src/trans_lang.py中,我们可以看到LunaTranslator如何使用标准JSON库实现语言文件导出:
with open(f"./files/lang/{kk}", "w", encoding="utf8") as ff:
ff.write(json.dumps(jsen, ensure_ascii=False, sort_keys=False, indent=4))
适用场景:
- 游戏MOD开发中的文本替换包
- 多语言对照数据库构建
- 配合脚本进行翻译质量分析
配置路径:全局配置文件defaultconfig/config.json中可设置JSON缩进字符数与编码格式。
TXT纯文本:轻量阅读与快速分享
对于只需保留对话顺序的场景,TXT格式提供最广泛的兼容性。虽然当前未直接发现TXT导出器实现,但通过clipboard.py的剪贴板输出功能,可间接实现文本捕获:
if (isorigin and self.config["origin"]) or ((not isorigin) and self.config["trans"]):
NativeUtils.ClipBoard.text = text
实操技巧:
- 在设置界面勾选"翻译后自动复制"
- 使用快捷键Ctrl+Shift+V粘贴到预设模板文件
- 配合正则表达式批量处理换行与缩进
模板文件:可参考docs/zh/emugames_template.md的文本组织方式。
WebSocket实时输出:多人协作新范式
对于直播翻译或团队协作场景,WebSocket输出提供毫秒级文本同步能力。websocket.py实现了基于WebSocket的实时广播:
def dispatch(self, text: str, isorigin: bool):
def __(handle):
if isorigin and isinstance(handle, TextOutputOrigin):
handle.send_text(text)
elif (not isorigin) and isinstance(handle, TextOutputTrans):
handle.send_text(text)
WSForEach(wsoutputsave, __)
部署方案:
- 启动内置WebSocket服务
- 在servicecollection.py中配置连接密码
- 使用支持WS协议的客户端工具接收(如wscat)
高级应用:自定义导出流程
通过扩展文本输出器基类,开发者可以实现专属导出格式。基础接口定义在outputerbase.py中:
class Base:
def dispatch(self, text: str, isorigin: bool):
pass # 需子类实现具体导出逻辑
def puttask(self, text, isorigin):
if not self.using:
return
self.queue.put((text, isorigin))
开发建议:
- 继承Base类实现Excel导出(可使用openpyxl库)
- 通过queue机制避免导出操作阻塞翻译主线程
- 在gui/setting/textinput.py中添加配置界面
最佳实践与常见问题
格式选择决策指南
| 格式 | 优势 | 适用场景 | 工具支持 |
|---|---|---|---|
| JSON | 结构化存储,支持嵌套 | 程序处理,多语言包 | 所有JSON解析器 |
| TXT | 轻量通用,兼容性好 | 阅读存档,简单分享 | 所有文本编辑器 |
| WS | 实时传输,多端同步 | 直播翻译,团队协作 | WebSocket客户端 |
性能优化技巧
当处理超过10万行的大型文本导出时,建议:
- 关闭config.json中的
indent参数减少JSON体积 - 使用transoptimi/目录下的文本压缩工具
- 分段导出避免内存占用过高
总结与展望
LunaTranslator通过模块化设计提供了灵活的文本导出解决方案,从基础的剪贴板输出到高级的WebSocket实时同步,覆盖了单机到团队的全场景需求。核心实现代码分布在:
- 导出接口:textio/textoutput/
- 格式处理:trans_lang.py
- 配置管理:defaultconfig/
未来版本计划加入Markdown表格导出和AI辅助排版功能,你可以通过docs/zh/gooduse/multiconfigs.md了解多配置管理技巧,或在项目Issues中提交功能建议。
提示:定期备份导出文件至docs/zh/目录下的归档文件夹,配合版本控制工具可实现翻译进度回溯。
收藏本文档,下次遇到翻译文本管理难题时,即可快速找到对应解决方案。关注项目更新,获取Excel导出功能的第一手教程!
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00