ClickHouse Operator 中 S3 存储表缩容时的数据清理问题分析

2025-07-04 09:55:13作者：尤辰城Agatha

问题背景

在使用 ClickHouse Operator 管理 Kubernetes 上的 ClickHouse 集群时，当集群缩容（减少副本数）且表使用 S3 存储时，会出现 S3 存储桶中遗留孤立文件的问题。这一问题不仅影响存储空间的有效利用，还可能导致数据不一致和潜在的安全风险。

问题现象

当执行以下操作序列时，可以重现该问题：

创建包含 2 个副本的 ClickHouse 集群，配置使用 S3 存储策略
创建使用 S3 存储的复制表并插入数据
将副本数从 2 缩减为 1
在剩余副本上删除表后，S3 存储桶中仍保留部分文件

测试环境使用 ClickHouse 24.3.2.3 和 clickhouse-operator 0.23.3 版本。

技术分析

根本原因

ClickHouse Operator 在处理缩容操作时，仅对 ReplicatedMergeTree 表、复制数据库、视图和字典执行清理操作。对于普通 MergeTree 表或 S3 存储的表，清理逻辑不完整，导致：

缩容时未同步删除 S3 上的数据文件
表删除操作可能异步执行，在操作完成前 Pod 已被终止
零拷贝复制和非零拷贝复制模式下都存在此问题

影响范围

该问题影响所有使用 S3 存储的 MergeTree 系列表，包括：

直接使用 S3 存储策略的表
使用 S3 磁盘配置的表
零拷贝和非零拷贝复制模式下的表

解决方案

临时解决方案

在缩容前，手动连接到将被移除的副本节点，执行显式的表删除操作：

DROP TABLE table_name SYNC;

使用 SYNC 关键字可确保表数据被同步删除，包括 S3 上的存储文件。

长期解决方案

ClickHouse Operator 在 0.24.0 版本中修复了此问题，改进内容包括：

完善了表删除逻辑，确保所有表类型都能被正确清理
增加了对 S3 存储文件的清理检查
优化了缩容时的资源回收流程

建议用户升级到 0.23.7 或更高版本以获得修复。

最佳实践

升级策略：定期升级 ClickHouse Operator 以获取最新的稳定性修复
缩容操作：在缩容前执行数据验证和清理检查
监控配置：设置对 S3 存储桶的监控，及时发现孤立文件
测试验证：在生产环境变更前，在测试环境验证缩容操作的数据清理效果

结论

ClickHouse Operator 的 S3 存储清理问题在较新版本中已得到修复。用户应当注意升级操作并遵循推荐的缩容流程，以确保数据的一致性和存储资源的有效利用。对于关键生产环境，建议在变更窗口执行缩容操作，并提前验证数据清理效果。

clickhouse-operator

Altinity Kubernetes Operator for ClickHouse creates, configures and manages ClickHouse clusters running on Kubernetes

项目地址：https://gitcode.com/GitHub_Trending/cl/clickhouse-operator

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。

rainbond

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理