pg_partman项目：基于多条件的分区表优化实践

2025-07-02 07:09:14作者：史锋燃Gardner

在PostgreSQL数据库管理中，分区表是提升大型数据表查询性能和维护效率的重要手段。pg_partman作为PostgreSQL的扩展工具，为分区表管理提供了自动化支持。本文将探讨一个典型场景：如何利用pg_partman实现基于不同列的多级分区策略，特别是针对"软删除"场景的优化方案。

业务场景分析

在实际应用中，很多系统采用"软删除"机制来处理数据删除操作。这种机制的特点包括：

不实际删除数据，而是通过标记字段（如deleted_bool）标识删除状态
设置删除时间戳（deleted_timestamp）记录删除操作时间
保留数据直到满足特定保留期限

这种设计带来了两个维度的数据管理需求：

活跃数据（未删除）按创建时间（record_timestamp）分区，优化业务查询
已删除数据按删除时间分区，便于过期数据清理

技术挑战

传统分区策略通常只能基于单一列进行分区，而上述场景需要：

第一级分区：按删除状态（布尔值）分离活跃和已删除数据
第二级分区：对两类数据分别采用不同的时间列进行分区

pg_partman解决方案

通过pg_partman可以实现这一复杂分区策略，具体步骤如下：

1. 初始分区设置

首先创建基于删除状态的一级分区。虽然pg_partman原生支持整数范围分区，但可以通过将布尔值转换为整数（0/1）来实现：

-- 将布尔列转换为整数
ALTER TABLE target_table ADD COLUMN deleted_int INTEGER;
UPDATE target_table SET deleted_int = CASE WHEN deleted_bool THEN 1 ELSE 0 END;

然后创建一级分区：

-- 创建按删除状态分区的父表
CREATE TABLE target_table_partitioned (
    -- 原表所有列
    record_timestamp TIMESTAMP,
    deleted_bool BOOLEAN,
    deleted_timestamp TIMESTAMP,
    deleted_int INTEGER,
    -- 其他列...
) PARTITION BY RANGE (deleted_int);

-- 创建活跃数据分区
CREATE TABLE target_table_active PARTITION OF target_table_partitioned
    FOR VALUES FROM (0) TO (1);

-- 创建已删除数据分区
CREATE TABLE target_table_deleted PARTITION OF target_table_partitioned
    FOR VALUES FROM (1) TO (2);

2. 二级分区配置

对两个分区分别设置不同的时间维度分区策略：

-- 对活跃数据分区按记录时间创建子分区
SELECT partman.create_parent(
    p_parent_table => 'public.target_table_active',
    p_control => 'record_timestamp',
    p_type => 'native',
    p_interval => '1 month',
    p_template_table => 'public.template_table'
);

-- 对已删除数据分区按删除时间创建子分区
SELECT partman.create_parent(
    p_parent_table => 'public.target_table_deleted',
    p_control => 'deleted_timestamp',
    p_type => 'native',
    p_interval => '1 month',
    p_template_table => 'public.template_table'
);

3. 模板表设计

为确保分区结构一致，建议创建模板表：

CREATE TABLE public.template_table (
    LIKE public.target_table
    INCLUDING DEFAULTS INCLUDING CONSTRAINTS INCLUDING INDEXES
);

实现优势

这种分层分区策略带来了以下好处：

查询性能优化：活跃数据查询只需扫描相关时间范围的分区
维护简化：通过直接删除最旧的已删除分区即可实现数据清理
灵活性：两类数据可以独立配置不同的保留策略和分区粒度

注意事项

实施时需考虑：

数据迁移策略：从原表迁移到分区表需要合理安排停机窗口
触发器处理：确保业务逻辑中的触发器在分区表上正常工作
监控调整：观察分区策略的实际效果，必要时调整分区粒度

总结

通过合理组合pg_partman的功能，我们可以构建适应复杂业务需求的分区策略。这种基于多条件的分区方法不仅适用于软删除场景，也可推广到其他需要多维数据管理的场景中，为大型PostgreSQL数据库的性能优化和维护提供了有力工具。

pg_partman

Partition management extension for PostgreSQL

项目地址：https://gitcode.com/gh_mirrors/pg/pg_partman

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

465

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

2.08 K

216