Textractor项目：Memories Off系列游戏特殊编码文本提取技术解析

2025-07-02 08:15:05作者：尤辰城Agatha

Extracts text from video games and visual novels. Highly extensible.

项目地址：https://gitcode.com/gh_mirrors/te/Textractor

背景概述

在视觉小说游戏汉化领域，Textractor作为一款强大的文本提取工具，经常需要针对不同游戏引擎的特殊编码进行处理。近期在Memories Off系列游戏（包括《Memories Off ~Sorekara~》和《Memories Off 2nd》）的文本提取过程中，发现这些使用MAGES引擎的游戏采用了特殊的自定义编码表，导致常规的文本提取方法失效。

技术难点分析

MAGES引擎游戏的特殊性主要体现在：

使用非标准字符编码表
游戏文本在内存中的存储格式与常见编码不同
需要特定的hook点才能准确捕获文本数据

解决方案实现

经过技术分析，我们确定了以下关键解决方案：

1. 游戏特定hook点定位

通过逆向分析游戏可执行文件，找到了各版本游戏的核心文本处理函数：

《Memories Off -Innocent Fille-》hook点：sub_431430->4319AF
《Memories Off 2nd》hook点：sub_42DDB0->42E3B2
《Memories Off ~Sorekara~》hook点：sub_42D990->42DF92

2. 专用h-code开发

针对不同游戏版本开发了特定的h-code：

《Memories Off -Innocent Fille-》：
HHN-C:-18@319AF:Game.exe

《Memories Off 2nd》：
HHN-4:-18@2E3B2:game.exe
HHN-8:-18@2E3B2:game.exe

《Memories Off ~Sorekara~》：
HHN-4:-18@2DF92:game.exe
HHN-8:-18@2DF92:game.exe

3. 编码转换处理

由于游戏使用MAGES自定义编码表，需要配合Textractor的Replacer.xdll扩展功能，使用专门的编码转换表(SavedReplacements.txt)进行字符映射转换。

技术要点说明

寄存器使用分析：
- 不同游戏版本使用不同的寄存器存储文本数据（EDX/EAX/ECX）
- 都需要对EBP寄存器进行分割处理
偏移量计算：
- 所有hook点都采用-18的偏移量
- 这是经过多次测试确定的最佳偏移值
多版本兼容：
- 部分游戏需要同时使用多个h-code才能完整捕获所有文本
- 这与游戏内部的多重文本处理机制有关

实际应用建议

确保使用最新版Textractor
正确放置SavedReplacements.txt文件
根据游戏版本选择对应的h-code组合
对于hook失败的情况，建议提供游戏主程序进行进一步分析

总结

通过对MAGES引擎的深入分析和特定hook点的开发，成功解决了Memories Off系列游戏的文本提取难题。这一解决方案不仅适用于上述游戏，其技术思路也可为其他使用相同引擎的游戏提供参考。未来随着游戏引擎的更新，可能需要进一步调整hook策略和编码转换方案。

Extracts text from video games and visual novels. Highly extensible.

项目地址：https://gitcode.com/gh_mirrors/te/Textractor

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

昇腾LLM分布式训练框架