Harvester项目中Kubelet内存回收机制的优化思考

2025-06-14 07:00:20作者：明树来

Harvester 是一个现代、开放、互操作的超融合基础设施（HCI）解决方案，基于 Kubernetes 构建。它为寻求云原生 HCI 解决方案的运营商提供了一个开源替代方案。Harvester 运行在裸金属服务器上，提供集成的虚拟化和分布式存储功能。除了传统的虚拟机（VM），Harvester 还通过与 Rancher 的集成支持容器化环境，统一了传统虚拟化基础设施，同时促进了从核心到边缘的容器采用。

项目地址：https://gitcode.com/gh_mirrors/har/harvester

在Rancher的Harvester项目中，当启用harvester-baremetal-container-workload实验性功能时，系统当前缺乏对内存资源限制的有效管控机制。这个问题值得我们深入探讨其技术背景和可能的优化方案。

问题背景

Harvester作为一款基于Kubernetes的轻量级虚拟化管理平台，在导入Rancher管理并启用裸金属容器工作负载功能时，现有的Kubelet配置存在潜在风险。当前的Kubelet启动参数仅配置了存储相关的回收阈值：

--eviction-hard=imagefs.available<5%,nodefs.available<5%
--eviction-minimum-reclaim=imagefs.available=10%,nodefs.available=10%

这种配置在混合部署虚拟机(VM)和裸金属容器工作负载的场景下，可能导致内存资源竞争问题。当两类工作负载同时出现内存使用高峰时，节点稳定性可能受到影响。

技术挑战分析

资源竞争风险：虚拟机工作负载和裸金属容器工作负载共享节点物理资源，特别是内存资源
缺乏保护机制：当前配置未设置内存回收阈值，可能导致内存耗尽引发OOM(Out Of Memory)事件
预测性不足：系统无法在内存资源紧张时提前采取回收措施，只能被动应对

建议优化方案

基于Kubernetes的节点压力驱逐机制，我们建议扩展Kubelet的驱逐参数配置：

--eviction-hard=imagefs.available<5%,nodefs.available<5%,memory.available<6Gi
--eviction-minimum-reclaim=imagefs.available=10%,nodefs.available=10%,memory.available=4Gi

这种配置具有以下优势：

主动防御：在内存低于6Gi时触发驱逐机制，避免内存完全耗尽
渐进回收：每次至少回收4Gi内存，确保系统有足够缓冲空间
综合保护：同时考虑存储和内存资源，提供全方位保护

实施考虑因素

阈值设定：具体数值应根据节点物理内存大小和典型工作负载特征进行调整
监控配套：需要建立配套的内存使用监控机制，观察驱逐事件频率
性能影响：评估内存回收对工作负载性能的影响，找到平衡点
动态调整：考虑实现根据工作负载特征动态调整阈值的能力

未来展望

随着Harvester对裸金属容器工作负载支持的成熟，资源隔离和管理机制需要持续完善。可能的扩展方向包括：

分级保护：为不同类型工作负载设置不同的保护级别
智能预测：基于历史数据预测内存使用趋势，提前调整
弹性配额：根据系统整体负载动态调整各类工作负载的资源配额

通过优化Kubelet的内存回收机制，可以显著提升Harvester在混合工作负载场景下的稳定性和可靠性，为用户提供更好的使用体验。

harvester

项目地址：https://gitcode.com/gh_mirrors/har/harvester

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

pytorch

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

openGauss kernel ~ openGauss is an open source relational database management system

C++

160

217