Git LFS 二进制文件迁移实战指南

2025-05-17 03:27:41作者：晏闻田Solitary

问题背景

在使用 Git 进行版本控制时，开发者经常会遇到需要管理大型二进制文件的情况。Git 本身并不是为处理大型二进制文件而设计的，这会导致仓库体积膨胀、克隆速度变慢等问题。Git LFS（Large File Storage）就是为了解决这个问题而生的扩展工具。

许多开发者在初次使用 Git LFS 时会遇到类似这样的问题：明明已经安装了 Git LFS 并配置了跟踪规则，但在推送包含二进制文件的提交时，仍然会收到"Your push was rejected because it contains binary files"的错误提示。

这种情况通常发生在以下场景：

要彻底解决这个问题，需要使用 Git LFS 的迁移功能来重写历史记录。具体步骤如下：

安装并初始化 Git LFS
```
git lfs install
```
确定需要迁移的文件模式 例如，对于 .caffemodel 文件：
```
git lfs track "*.caffemodel"
```
执行历史记录迁移
```
git lfs migrate import --everything --include="*.caffemodel"
```
这个命令会扫描整个 Git 历史，将所有匹配 *.caffemodel 的文件转换为 LFS 对象。
强制推送更新
```
git push --force
```
由于我们修改了历史记录，需要使用强制推送来更新远程仓库。

备份重要数据：重写 Git 历史是一项危险操作，建议在执行前确保有完整的备份。
团队协作影响：如果这是一个多人协作的项目，所有团队成员都需要重新克隆仓库或在本地执行特定的重置操作。
选择性迁移：--include 参数支持更复杂的模式匹配，可以根据实际需求调整，例如：
```
git lfs migrate import --everything --include="*.caffemodel,*.bin"
```
验证迁移结果：迁移完成后，可以使用以下命令检查文件是否已正确转换为 LFS 对象：
```
git lfs ls-files
```

Git LFS 的工作原理是将大文件存储在单独的服务器上，而在 Git 仓库中只保留指向这些文件的指针。当执行 git lfs migrate import 时，Git LFS 会：

这个过程确保了历史记录中的所有相关文件都被正确处理，而不仅仅是新添加的文件。

通过遵循这些实践，开发者可以有效地管理项目中的大型二进制文件，保持 Git 仓库的高效运行。

登录后查看全文