Harvester项目中资源配额与虚拟机迁移的竞态问题分析与解决方案

2025-06-15 08:06:57作者：羿妍玫Ivan

Harvester 是一个现代、开放、互操作的超融合基础设施（HCI）解决方案，基于 Kubernetes 构建。它为寻求云原生 HCI 解决方案的运营商提供了一个开源替代方案。Harvester 运行在裸金属服务器上，提供集成的虚拟化和分布式存储功能。除了传统的虚拟机（VM），Harvester 还通过与 Rancher 的集成支持容器化环境，统一了传统虚拟化基础设施，同时促进了从核心到边缘的容器采用。

项目地址：https://gitcode.com/gh_mirrors/har/harvester

问题背景

在Kubernetes环境中，资源配额(ResourceQuota)是管理命名空间资源使用的重要机制。当Harvester作为Rancher的下游集群运行时，两者对资源配额的管理会存在交互问题。特别是在虚拟机(VM)迁移场景下，Harvester需要临时调整资源配额以容纳迁移目标，而Rancher会定期同步配额配置，这种竞态条件可能导致迁移失败。

问题现象

在特定条件下，当节点维护或升级触发虚拟机迁移时，系统可能出现以下异常：

迁移目标Pod创建失败，virt-controller报错"exceeded quota"
资源配额被意外修改，不符合用户预期配置
虚拟机迁移过程被中断

技术分析

竞态条件形成机制

Rancher的资源配额管理：
- 通过namespace注解(field.cattle.io/resourceQuota)维护配额配置
- cattle-cluster-agent负责将注解同步到实际的ResourceQuota对象
- 当agent Pod重启时，会强制将配额重置为注解中的值
Harvester的迁移机制：
- 迁移过程中自动调高资源配额，为目标Pod预留资源
- 迁移完成后自动恢复原始配额值
- 通过vmim_controller实现配额动态调整
竞态发生场景：
- 命名空间资源使用率已达80%以上
- 多个VM运行在同一节点
- cattle-cluster-agent Pod也位于该节点
- 节点维护触发VM迁移和agent Pod重建同时发生

问题本质

当三个行为同时发生时：

Harvester为迁移临时提高配额
Rancher agent重建并恢复原始配额
用户可能同时修改配额配置

导致最终配额值不符合任何一方的预期，出现"配额被意外修改"的现象。

解决方案

Harvester团队通过引入ResourceQuota控制器解决了这一问题，主要改进包括：

动态配额计算机制：
- 控制器同时考虑Rancher注解和Harvester的临时调整
- 实际配额=用户配置值+迁移所需增量
- 确保迁移期间配额足够，同时保持用户配置可见性
配额修改验证：
- Webhook阻止在迁移过程中降低配额的操作
- 防止用户配置与系统需求冲突
长名称支持：
- 修复了长VM名称导致的配额记录问题
- 确保各种命名规范的VM都能正常迁移