Harvester项目中升级日志清理机制的优化分析

2025-06-14 21:03:42作者：秋阔奎Evelyn

背景介绍

在Harvester集群升级过程中，升级日志(UpgradeLog)是一个重要的功能组件，它负责收集和存储升级过程中的各类日志信息，为后续问题排查提供依据。然而，在v1.4.1版本中，我们发现当用户手动删除升级对象时，升级日志相关的资源未能被完全清理，这可能导致系统残留不必要的资源。

问题现象

在Harvester v1.4.1版本中，当用户执行以下操作序列时会出现资源残留问题：

安装v1.4.1版本集群
禁用rancher-logging插件
触发升级到v1.5.0版本并启用升级日志功能
通过kubectl手动删除升级对象
发现managedchart资源（如hvst-upgrade-*-upgradelog-operator）及其相关资源未被清理

技术分析

问题的核心在于升级日志的清理逻辑存在缺陷。在控制器代码中，虽然设计了清理函数，但在某些情况下（特别是当rancher-logging插件被禁用时），清理逻辑未能正确执行。

具体表现为：

升级日志相关的Fluentd/FluentBit Pod实例未被删除
对应的managedchart资源残留
持久化卷声明(PVC)等资源未被释放

这种资源泄漏不仅会占用系统资源，还可能影响后续的升级操作，特别是在多次升级场景下可能导致资源冲突。

解决方案

开发团队通过两个主要PR（#7653和#7660）修复了这一问题。修复的核心内容包括：

强制清理机制：无论rancher-logging插件的状态如何，都会确保清理managedchart资源
资源级联删除：确保所有相关的Kubernetes资源（包括Pod、PVC等）都被正确清理
错误处理增强：优化了清理过程中的错误处理逻辑，防止部分失败导致整体清理中断

验证方法

为确保修复效果，可以采用以下测试流程：

部署v1.5.0版本集群（包含修复代码）
禁用rancher-logging插件
触发升级操作并启用升级日志功能
手动删除升级对象
验证：
- 检查所有Fluentd/FluentBit相关Pod是否已被删除
- 确认managedchart资源已被清理
- 确保没有残留的持久化存储资源

技术意义

这一修复不仅解决了特定场景下的资源清理问题，更重要的是：

提升系统健壮性：确保升级过程中的资源生命周期管理更加可靠
避免资源泄漏：防止因多次升级操作导致的系统资源浪费
增强用户体验：为用户提供更干净的升级后环境，减少手动清理需求

最佳实践建议

对于Harvester用户和管理员，建议：

在升级前检查系统插件状态，特别是日志相关插件
定期检查系统资源使用情况，及时发现可能的资源泄漏
在遇到升级问题时，优先考虑使用官方支持的最新版本
在测试环境中验证升级流程后再在生产环境执行

这一问题的修复体现了Harvester项目对系统可靠性的持续关注，也展示了开源社区通过协作快速解决问题的优势。

harvester

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

Harvester项目中升级日志清理机制的优化分析

背景介绍

问题现象

技术分析

解决方案

验证方法

技术意义

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

Harvester项目中升级日志清理机制的优化分析

背景介绍

问题现象

技术分析

解决方案

验证方法

技术意义

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选