MyDumper在Percona 8.4.2副本上导出时产生巨大日志文件问题分析

2025-06-29 20:56:34作者：牧宁李

问题现象

在使用MyDumper工具对运行Percona 8.4.2的副本数据库进行导出操作时，发现了一个异常现象：当使用0.16.9-1版本时，导出过程明显变慢，并且生成了异常庞大的日志文件（约120MB）。相比之下，0.16.5-1版本则表现正常。

日志文件中充斥着大量关于mysql.time_zone_transition表的进度信息记录，统计显示相关日志条目达到了127万条之多。虽然最终生成的备份文件看起来正常，但巨大的日志文件不仅占用磁盘空间，也给问题排查带来了不便。

经过深入分析，这个问题源于MyDumper 0.16.9-1版本中引入的一个变更。具体来说，MIN_CHUNK_STEP_SIZE参数被错误地设置为10（本应为1000），导致在处理具有多列主键的表时，MyDumper会执行过多的查询操作。

mysql.time_zone_transition表恰好具有多列主键。第一列的值分布正常，但第二列的值分布较为分散。由于MIN_CHUNK_STEP_SIZE设置过小，MyDumper不仅按第一列进行分片，还会尝试按第二列进行精细分片，从而产生了大量不必要的查询和日志记录。

针对这个问题，开发团队已经确认并提供了两种解决方案：

临时解决方案：在执行MyDumper命令时，通过-r 1000:0:0参数手动设置分片步长。这个参数告诉MyDumper只按第一列进行分片，步长为1000，忽略其他列的分片。
永久修复：开发团队已经提交了修复代码，将MIN_CHUNK_STEP_SIZE的正确值恢复为1000，并计划在下一个版本中发布这个修复。

在数据库备份工具中，处理大表时通常采用分片（chunking）技术来提高效率和可靠性。MyDumper通过分析表的主键或唯一键，将表数据分成多个小块进行导出。对于多列主键的表，合理的分片策略尤为重要：

在本次案例中，mysql.time_zone_transition表存储了时区转换规则，其数据结构特点导致了这个问题特别明显。正确的分片策略应该基于表的数据分布特征进行调整，而不是使用固定的小步长。

为了避免类似问题，建议数据库管理员：

通过这次事件，我们再次认识到数据库工具参数配置的重要性，即使是看似微小的数值变化，也可能在实际生产环境中产生显著影响。

登录后查看全文