MyDumper分区备份实战：使用partition-regex精准备份单个分区

2025-06-29 14:19:44作者：瞿蔚英Wynne

分区备份需求背景

在MySQL数据库管理中，分区表是一种常见的设计模式，它通过将大表物理分割成多个小分区来提高查询性能和管理效率。然而，在日常运维中，我们经常遇到只需要备份特定分区数据的需求，而不是整个表。MyDumper作为一款高性能的MySQL逻辑备份工具，提供了partition-regex参数来支持这种精细化备份需求。

partition-regex参数详解

partition-regex是MyDumper中用于匹配特定分区名的正则表达式参数。当我们需要备份单个分区时，可以结合-T参数(指定表名)和partition-regex参数来实现精准备份。

该参数的基本语法格式为：

--partition-regex='^(?=((分区名$)))'

实际案例分析

假设我们有一个名为payment_qa.tr_order的分区表，包含两个分区：

p2311分区(当前无数据)
p9999分区(包含2931条记录)

正确备份单个分区的方法

要备份p9999分区，应使用以下命令：

mydumper -u root -p 密码 -h 主机名 --ssl-mode=disabled -r 20000 -o 输出目录 --csv --partition-regex='^(?=((p9999$)))' -T payment_qa.tr_order

关键参数说明

-T payment_qa.tr_order：明确指定要备份的表名
--partition-regex='^(?=((p9999$)))'：使用正则表达式精确匹配名为p9999的分区
--csv：指定以CSV格式输出数据
-r 20000：设置行分割数量

验证备份结果

执行备份后，可以通过以下方式验证：

cat 输出目录/payment_qa.tr_order.00000.dat | wc -l

输出应为分区中的实际数据行数(本例为2931行)，这确认了我们确实只备份了指定分区的数据。

常见问题排查

备份结果包含全表数据：通常是因为正则表达式编写错误或未正确使用-T参数指定表名
分区无数据但备份文件存在：这是正常现象，MyDumper会为匹配的分区创建文件，即使其中没有数据
正则表达式语法错误：确保使用正确的正则语法，特别是结束符$的使用

最佳实践建议

在执行分区备份前，先查询确认分区名称和数据量：

SELECT PARTITION_NAME, TABLE_ROWS 
FROM INFORMATION_SCHEMA.PARTITIONS 
WHERE TABLE_SCHEMA='库名' AND TABLE_NAME='表名';

对于重要备份操作，先在小规模测试环境验证命令的正确性
考虑将常用分区备份命令脚本化，减少人为错误
定期验证备份文件的完整性和准确性

总结

MyDumper的partition-regex参数为DBA提供了灵活的分区级备份能力，特别适合处理大型分区表的精细化备份需求。通过正确使用正则表达式和表名参数，我们可以实现精确到单个分区的数据备份，既提高了备份效率，又节省了存储空间。掌握这一技巧对于管理生产环境中的大型分区表尤为重要。

mydumper

Official MyDumper Project

项目地址：https://gitcode.com/gh_mirrors/my/mydumper

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

413

339

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java