pgBackRest在GCS存储中实现批量删除优化备份过期性能

2025-06-27 10:06:00作者：翟萌耘Ralph

pgBackRest作为PostgreSQL生态中高性能的备份恢复工具，近期在其2.52版本中针对Google Cloud Storage（GCS）存储后端实现了一项重要优化——批量删除操作。这项改进显著提升了备份过期（expire）阶段的执行效率，解决了用户在实际生产环境中遇到的性能瓶颈问题。

背景与问题发现

在实际生产环境中，部分用户发现当使用GCS作为备份存储时，备份操作本身能够快速完成（例如15分钟内），但随后的过期文件清理过程却异常缓慢（长达7小时以上）。这种现象在启用repo-bundle功能后虽有所改善（降至2.5小时），但依然存在明显的性能问题。

经过技术分析发现，根本原因在于旧版本中pgBackRest对GCS存储采用单文件逐个删除的方式。这种实现方式会产生大量独立的HTTP请求，导致显著的网络延迟和操作开销。

技术实现方案

pgBackRest开发团队深入研究了GCS的批量操作API特性，特别是其支持的批处理请求功能。GCS批量API允许将多个操作（如删除）合并到单个HTTP请求中，通过multipart请求体一次提交多个操作指令。

在2.52版本中，开发团队重构了过期处理逻辑，主要改进包括：

实现GCS批量删除接口集成
优化文件删除队列处理机制
自动检测GCS存储类型并启用批量模式
保持与现有配置的兼容性

值得注意的是，这项优化是自动生效的，用户无需进行任何额外配置即可享受性能提升。

性能对比与最佳实践

根据用户反馈和技术测试，批量删除实现后带来了显著的性能提升：

原先需要7小时以上的过期操作缩短至合理时间范围
系统资源利用率显著提高
减少了因过期操作延迟导致的备份计划冲突

对于追求极致性能的用户，建议结合以下配置使用：

启用repo-bundle功能，将小文件打包存储
合理设置保留策略，避免单次过期过多文件
监控网络带宽，确保足够的吞吐量

未来发展方向

pgBackRest团队已经将Azure存储的批量删除支持列入开发计划。当前GCS的优化方案也为其他云存储服务的性能优化提供了技术参考。随着云原生技术的普及，pgBackRest将继续深化与各云平台的集成优化，为用户提供更高效的备份恢复体验。

对于正在使用GCS作为存储后端的用户，升级到2.52或更高版本将直接获得这项性能改进。团队也欢迎用户反馈实际使用效果，以持续优化产品性能。

pgbackrest

Reliable PostgreSQL Backup & Restore

项目地址：https://gitcode.com/gh_mirrors/pg/pgbackrest

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

pytorch

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

openGauss kernel ~ openGauss is an open source relational database management system

C++

160

217