Harvester项目中备份目标配置导致CPU高负载问题的分析与解决

2025-06-14 15:27:17作者：温玫谨Lighthearted

问题背景

在Harvester虚拟化管理平台从v1.4.1升级到v1.4.2版本后，用户报告系统出现了harvester进程CPU使用率异常升高的情况。这一问题主要发生在配置了备份目标（如NFS存储）的环境中，对系统性能造成了显著影响。

问题现象

升级完成后，系统监控显示harvester进程持续占用大量CPU资源，导致整体系统负载升高。通过top命令可以观察到harvester进程的CPU使用率异常偏高，远超过正常水平。

根本原因分析

经过开发团队深入调查，发现问题根源在于备份目标的配置参数处理逻辑上。具体来说：

当用户配置备份目标时，如果未明确设置"refreshIntervalInSeconds"（刷新间隔秒数）参数值
系统在v1.4.2版本中对此情况的处理存在缺陷
导致后台进程不断尝试刷新备份目标状态，形成高频循环
这种频繁的无意义操作消耗了大量CPU资源

解决方案

开发团队提供了两种解决方式：

临时解决方案（适用于已升级到v1.4.2的用户）

进入Harvester管理界面
导航到备份目标配置页面
为"refreshIntervalInSeconds"参数设置一个非零值（如300表示5分钟）
保存配置后，系统CPU负载将恢复正常

永久修复方案

该问题已在以下版本中得到彻底修复：

v1.5.0版本的主线代码中通过PR#7684修复
针对v1.4分支的修复通过PR#7888实现
修复后的版本将包含在未来的v1.4.3发布中

技术实现细节

修复方案主要优化了以下方面：

增加了对refreshIntervalInSeconds参数的合法性检查
设置了合理的默认刷新间隔
优化了备份目标状态检查的逻辑流程
避免了无效的高频刷新操作

验证结果

测试团队在v1.5分支的最新代码上进行了验证：

部署全新Harvester系统
配置Minio S3作为备份目标
监控harvester进程的CPU使用率
结果显示CPU负载保持在正常水平（<1%）

用户建议

对于不同情况的用户，建议采取以下措施：

计划升级的用户：建议直接升级到已修复该问题的版本（v1.5.0或未来的v1.4.3）
已升级到v1.4.2的用户：按照临时解决方案设置refreshIntervalInSeconds参数
新部署用户：建议使用最新稳定版本，避免此问题

总结

Harvester团队快速响应并解决了这一性能问题，体现了开源社区对产品质量的重视。该案例也提醒我们，在系统升级和存储配置时，需要关注相关参数的合理设置，以确保系统稳定运行。

harvester

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

515

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

284

Harvester项目中备份目标配置导致CPU高负载问题的分析与解决

问题背景

问题现象

根本原因分析

解决方案

临时解决方案（适用于已升级到v1.4.2的用户）

永久修复方案

技术实现细节

验证结果

用户建议

总结

热门内容推荐

最新内容推荐

项目优选

Harvester项目中备份目标配置导致CPU高负载问题的分析与解决

问题背景

问题现象

根本原因分析

解决方案

临时解决方案（适用于已升级到v1.4.2的用户）

永久修复方案

技术实现细节

验证结果

用户建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选