告别混乱翻译记录:LunaTranslator多格式导出全攻略
你是否还在为Galgame翻译文本的整理发愁?手动复制粘贴到记事本导致格式错乱,想统计台词频率却困于无法解析的文本?LunaTranslator提供从TXT到JSON的全流程导出方案,让翻译记录管理效率提升10倍。本文将详解3种核心导出格式的使用场景与实操技巧,附带配置文件路径与代码示例。
为什么需要专业文本导出功能?
Galgame翻译过程中,文本记录往往面临三大痛点:
- 碎片化管理:分散在剪贴板、截图和临时文件中的翻译内容难以追溯
- 多场景适配:同人创作需要纯文本,数据分析依赖结构化格式,二次编辑则需要表格
- 协作与存档:团队翻译时缺乏标准化的文本交换格式
LunaTranslator通过模块化输出架构解决这些问题,其核心实现位于src/LunaTranslator/textio/textoutput/目录,包含基础接口outputerbase.py与多种导出实现类。
三种核心导出格式全解析
JSON格式:结构化数据的最佳选择
JSON格式凭借其层级结构优势,成为存储对话树和多语言对照的理想方案。在src/trans_lang.py中,我们可以看到LunaTranslator如何使用标准JSON库实现语言文件导出:
with open(f"./files/lang/{kk}", "w", encoding="utf8") as ff:
ff.write(json.dumps(jsen, ensure_ascii=False, sort_keys=False, indent=4))
适用场景:
- 游戏MOD开发中的文本替换包
- 多语言对照数据库构建
- 配合脚本进行翻译质量分析
配置路径:全局配置文件defaultconfig/config.json中可设置JSON缩进字符数与编码格式。
TXT纯文本:轻量阅读与快速分享
对于只需保留对话顺序的场景,TXT格式提供最广泛的兼容性。虽然当前未直接发现TXT导出器实现,但通过clipboard.py的剪贴板输出功能,可间接实现文本捕获:
if (isorigin and self.config["origin"]) or ((not isorigin) and self.config["trans"]):
NativeUtils.ClipBoard.text = text
实操技巧:
- 在设置界面勾选"翻译后自动复制"
- 使用快捷键Ctrl+Shift+V粘贴到预设模板文件
- 配合正则表达式批量处理换行与缩进
模板文件:可参考docs/zh/emugames_template.md的文本组织方式。
WebSocket实时输出:多人协作新范式
对于直播翻译或团队协作场景,WebSocket输出提供毫秒级文本同步能力。websocket.py实现了基于WebSocket的实时广播:
def dispatch(self, text: str, isorigin: bool):
def __(handle):
if isorigin and isinstance(handle, TextOutputOrigin):
handle.send_text(text)
elif (not isorigin) and isinstance(handle, TextOutputTrans):
handle.send_text(text)
WSForEach(wsoutputsave, __)
部署方案:
- 启动内置WebSocket服务
- 在servicecollection.py中配置连接密码
- 使用支持WS协议的客户端工具接收(如wscat)
高级应用:自定义导出流程
通过扩展文本输出器基类,开发者可以实现专属导出格式。基础接口定义在outputerbase.py中:
class Base:
def dispatch(self, text: str, isorigin: bool):
pass # 需子类实现具体导出逻辑
def puttask(self, text, isorigin):
if not self.using:
return
self.queue.put((text, isorigin))
开发建议:
- 继承Base类实现Excel导出(可使用openpyxl库)
- 通过queue机制避免导出操作阻塞翻译主线程
- 在gui/setting/textinput.py中添加配置界面
最佳实践与常见问题
格式选择决策指南
| 格式 | 优势 | 适用场景 | 工具支持 |
|---|---|---|---|
| JSON | 结构化存储,支持嵌套 | 程序处理,多语言包 | 所有JSON解析器 |
| TXT | 轻量通用,兼容性好 | 阅读存档,简单分享 | 所有文本编辑器 |
| WS | 实时传输,多端同步 | 直播翻译,团队协作 | WebSocket客户端 |
性能优化技巧
当处理超过10万行的大型文本导出时,建议:
- 关闭config.json中的
indent参数减少JSON体积 - 使用transoptimi/目录下的文本压缩工具
- 分段导出避免内存占用过高
总结与展望
LunaTranslator通过模块化设计提供了灵活的文本导出解决方案,从基础的剪贴板输出到高级的WebSocket实时同步,覆盖了单机到团队的全场景需求。核心实现代码分布在:
- 导出接口:textio/textoutput/
- 格式处理:trans_lang.py
- 配置管理:defaultconfig/
未来版本计划加入Markdown表格导出和AI辅助排版功能,你可以通过docs/zh/gooduse/multiconfigs.md了解多配置管理技巧,或在项目Issues中提交功能建议。
提示:定期备份导出文件至docs/zh/目录下的归档文件夹,配合版本控制工具可实现翻译进度回溯。
收藏本文档,下次遇到翻译文本管理难题时,即可快速找到对应解决方案。关注项目更新,获取Excel导出功能的第一手教程!
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00
ERNIE-ImageERNIE-Image 是由百度 ERNIE-Image 团队开发的开源文本到图像生成模型。它基于单流扩散 Transformer(DiT)构建,并配备了轻量级的提示增强器,可将用户的简短输入扩展为更丰富的结构化描述。凭借仅 80 亿的 DiT 参数,它在开源文本到图像模型中达到了最先进的性能。该模型的设计不仅追求强大的视觉质量,还注重实际生成场景中的可控性,在这些场景中,准确的内容呈现与美观同等重要。特别是,ERNIE-Image 在复杂指令遵循、文本渲染和结构化图像生成方面表现出色,使其非常适合商业海报、漫画、多格布局以及其他需要兼具视觉质量和精确控制的内容创作任务。它还支持广泛的视觉风格,包括写实摄影、设计导向图像以及更多风格化的美学输出。Jinja00