MyDumper恢复过程中长时间挂起问题的分析与解决

2025-06-29 19:44:08作者：范垣楠Rhoda

问题背景

在使用MyDumper进行MySQL/MariaDB数据库备份恢复时，部分用户遇到了恢复过程长时间挂起的问题。具体表现为myloader进程在恢复大型表时停滞不前，持续时间可达60小时以上，同时数据库服务器CPU占用率达到100%，但磁盘I/O却处于空闲状态。

问题现象分析

从用户报告的情况来看，问题主要出现在恢复包含大量数据的表时。通过检查数据库状态，可以观察到以下关键现象：

InnoDB引擎警告无法释放缓冲池中的块，提示需要考虑增加innodb_buffer_pool_size参数
数据库进程列表中显示长时间运行的INSERT操作
服务器CPU核心出现100%占用情况
磁盘I/O指标显示系统处于空闲状态
InnoDB状态报告中显示大量undo日志条目积累

根本原因

经过深入分析，这个问题主要由以下几个因素共同导致：

大事务处理：myloader默认会将大量数据放在单个事务中处理，导致undo日志不断积累，最终耗尽系统资源。
管道文件处理：默认的fifodir设置可能导致进程间通信出现问题，特别是在处理压缩数据时。
并发控制不当：高并发恢复操作与数据库内部机制产生冲突，特别是在存在外键约束的情况下。

解决方案

针对上述问题根源，我们推荐以下解决方案：

1. 调整事务处理粒度

使用--queries-per-transaction=1参数可以显著改善大事务导致的问题。这个参数将每个查询放在单独的事务中执行，避免了undo日志的过度积累。

2. 明确指定fifodir参数

建议显式设置--fifodir参数指向一个空目录，并在每次恢复前清空该目录。例如：

rm -rf /var/tmp/mydumper_fifo
mkdir -p /var/tmp/mydumper_fifo
myloader --fifodir=/var/tmp/mydumper_fifo ...

3. 合理设置并发线程数

根据数据库特性和服务器配置调整线程数：

对于有外键约束的数据库，建议使用较少的线程（如2-6个）
对于没有外键约束的数据库，可以适当增加线程数（如40个）

4. 优化数据库参数配置

在my.cnf中增加以下配置可能有助于改善恢复性能：

innodb_buffer_pool_size=足够大的值（如物理内存的70-80%）
innodb_log_file_size=2G
innodb_log_buffer_size=32M
max_allowed_packet=1G

最佳实践建议

监控恢复过程：定期检查数据库进程列表和InnoDB状态，及时发现潜在问题。
分批恢复：对于特别大的表，考虑单独恢复或使用--regex参数过滤。
资源预留：确保服务器有足够的内存和CPU资源处理恢复操作，避免与其他服务争抢资源。
版本选择：使用较新版本的MyDumper/myloader（如v0.16.11-2或更高版本），这些版本对大型数据库恢复有更好的支持。

总结

MyDumper/myloader是强大的MySQL/MariaDB备份恢复工具，但在处理大型数据库时需要特别注意配置参数。通过合理设置事务粒度、管道目录和并发线程数，可以避免恢复过程中的长时间挂起问题。未来版本的MyDumper将进一步优化这些问题，提供更稳定的大数据量恢复体验。

mydumper

Official MyDumper Project

项目地址：https://gitcode.com/gh_mirrors/my/mydumper

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。