使用immich-go导入Google Takeout数据时JSON文件缺失问题的分析与解决

2025-06-27 12:27:31作者：舒璇辛Bertina

问题背景

immich-go是一个用于将Google Takeout数据导入到Immich自托管照片管理服务的工具。在实际使用过程中，用户报告了两个主要问题：

工具尝试处理非Google Photos路径下的文件（如联系人照片），导致大量"JSON File not found"错误
文件名编码问题导致特殊字符（如德语中的"ä"）显示异常

问题分析

JSON文件缺失问题

当用户使用完整Google Takeout备份（包含所有服务数据）时，immich-go会扫描整个Takeout目录结构，而不仅仅是Google Photos路径。这导致工具尝试处理联系人照片等非照片数据时失败，因为这些文件缺少必要的JSON元数据文件。

文件名编码问题

当用户将多个Takeout ZIP文件合并为一个大文件时，文件名中的非ASCII字符（如德语"ä"）会被错误地编码为",,"。这是由于ZIP文件格式的历史遗留问题：

传统ZIP文件使用CP-437编码（IBM-PC 1981年的编码）
现代ZIP文件应使用UTF-8编码
某些ZIP工具在合并文件时可能错误地处理了文件名编码

解决方案

针对JSON文件缺失问题

推荐方法：直接使用Google Takeout生成的所有ZIP文件，无需合并
```
./immich-go -server=your_server -key=your_key upload -google-photos takeout-*.zip
```
工具会自动处理分散在不同ZIP中的文件和元数据
临时解决方案：如果必须合并文件，确保使用支持UTF-8文件名编码的ZIP工具

针对文件名编码问题

避免合并ZIP文件：直接使用Google Takeout生成的原始ZIP文件集合
检查ZIP工具设置：如果必须合并，确保使用的ZIP工具正确处理UTF-8编码

最佳实践建议

使用原始Takeout文件：不要手动合并Google Takeout生成的ZIP文件
完整路径处理：确保所有相关ZIP文件在同一目录下，使用通配符一次性处理
编码检查：如果发现文件名显示异常，尝试使用不同ZIP工具重新打包
分批处理：对于大量数据，可以考虑分批导入以避免内存问题

技术实现细节

immich-go在处理Google Takeout数据时：

依赖JSON元数据文件获取照片的完整信息
自动关联媒体文件与其对应的元数据
支持处理分散在多个ZIP文件中的数据和元数据
对文件名编码有自动检测机制，但可能受ZIP文件本身编码影响

总结

immich-go工具在导入Google Takeout数据时，最可靠的方法是直接使用Google生成的原始ZIP文件集合，避免手动合并操作。这不仅能解决JSON元数据文件关联问题，还能确保文件名编码正确无误。对于开发者而言，未来可以考虑增加对非Google Photos路径的智能过滤，以及更健壮的文件名编码处理机制。

immich-go

An alternative to the immich-CLI command that doesn't depend on nodejs installation. It tries its best for importing google photos takeout archives.

项目地址：https://gitcode.com/gh_mirrors/im/immich-go

登录后查看全文