ClickHouse Operator 0.24.3版本发布:增强集群管理与监控能力
ClickHouse Operator是一个用于在Kubernetes环境中自动化部署和管理ClickHouse集群的工具。它简化了ClickHouse集群的创建、配置、扩展和维护过程,使企业能够更高效地运行ClickHouse数据库服务。
新增功能亮点
集群暂停管理功能
新版本引入了.spec.suspend属性,允许管理员暂停ClickHouseInstallation和ClickHouseKeeper资源的协调过程。这一功能特别适用于需要进行维护或问题排查的场景,管理员可以临时停止Operator对集群的自动管理,而不会影响现有服务的正常运行。
增强的监控指标
metrics-exporter现在新增了clickhouse_operator_chi指标,为集群健康状态监控提供了更多维度的数据支持。同时,新增了与Kafka相关的告警规则,使得集成Kafka作为数据源的ClickHouse集群能够获得更全面的监控覆盖。
架构优化与改进
配置管理重构
新版本将用于规划协调过程的NormalizedCHI从CHI状态迁移到了独立的ConfigMap对象中。这一架构调整使得配置管理更加清晰,减少了状态对象的复杂度,同时提高了系统的可维护性。
优雅重启机制
Operator改进了ClickHouse服务重启的方式。当需要应用服务器配置变更时,不再直接重建Pod,而是优先尝试使用SYSTEM SHUTDOWN命令。这一优化显著提升了具有大容量存储节点的重启速度,因为不再需要重新挂载存储卷。
安全与稳定性增强
安全问题修复
新版本修复了golang.org/x/net库中的CVE-2024-45338安全问题,提升了系统的安全性。同时,移除了不再使用的'HostsUnchanged'和'HostsDelete'状态字段,简化了系统实现。
ZooKeeper路径管理优化
对于已停止的CHI资源,Operator不再重试创建自定义ZooKeeper路径,避免了不必要的操作。此外,当为主集群定义了interserver secret时,现在会自动应用于'all-sharded'集群,简化了安全配置管理。
监控系统升级
新版本将prometheus-operator升级至0.79.0版本,并与prometheus 3.0.1进行了兼容性测试,提供了更稳定和现代的监控基础设施支持。
ClickHouse Operator 0.24.3版本通过这些改进,进一步提升了在Kubernetes环境中管理ClickHouse集群的便利性、安全性和可靠性,为企业级部署提供了更强大的支持。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0214
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03