Sanoid项目中Syncoid备份不同步问题分析与解决

2025-06-25 06:17:52作者：胡易黎Nicole

These are policy-driven snapshot management and replication tools which use OpenZFS for underlying next-gen storage. (Btrfs support plans are shelved unless and until btrfs becomes reliable.)

项目地址：https://gitcode.com/gh_mirrors/sa/sanoid

问题背景

在使用Sanoid和Syncoid进行ZFS备份时，用户发现备份数据集与源数据集出现了不同步的情况。尽管配置了自动快照和同步策略，但备份端的快照明显落后于源端，且部分快照显示为0字节占用空间。这种情况可能导致在需要恢复数据时无法获取最新的备份版本。

配置分析

用户的生产环境配置如下：

生产服务器配置：

[storage/services]
frequently = 0
hourly = 12
daily = 7
monthly = 3
yearly = 0
recursive = yes
autosnap = yes
autoprune = yes

备份服务器配置：

[storage/backups]
frequently = 0
hourly = 0
daily = 7
monthly = 3
yearly = 0
recursive = yes
autosnap = no  # 错误配置
autoprune = yes

同步命令：

syncoid \
--recursive \
--no-sync-snap \
--create-bookmark \
--no-rollback \  # 关键问题点
--no-privilege-elevation \
storage/services \
zfs-recv@10.3.14.223:storage/backups/node24/services

问题诊断

快照时间戳不匹配：源端和备份端的快照时间戳存在差异（如00:00:01 vs 00:00:02），这表明备份服务器可能自行创建了快照而非完全同步源端快照。
0字节快照：备份端的快照显示0字节占用，这是典型的快照创建但未实际同步数据的表现。
配置解析问题：备份服务器的autosnap = no配置后带有注释，Sanoid可能将整行作为值解析，导致实际启用了自动快照功能。
回滚策略冲突：用户在生产环境执行了手动回滚操作，但同步命令中指定了--no-rollback，导致备份端无法与源端保持同步状态。

解决方案

修正配置文件：
- 移除配置行中的注释，确保Sanoid正确解析配置值
- 备份服务器应完全禁用自动快照功能
调整同步命令：
- 移除--no-rollback参数，允许备份端跟随源端的回滚操作
- 考虑添加--force-delete参数处理不一致的快照
错误处理改进：
- 避免通过su -c执行命令导致错误信息被屏蔽
- 添加日志记录和错误通知机制
快照命名规范：
- 统一手动快照和自动快照的命名规则
- 考虑使用前缀区分不同类型快照