Kubernetes调度器性能测试中的PreemptionPVs问题分析

2025-04-28 22:49:12作者：沈韬淼Beryl

Production-Grade Container Scheduling and Management

项目地址：https://gitcode.com/GitHub_Trending/kuber/kubernetes

背景介绍

在Kubernetes项目中，调度器性能测试是保证集群调度效率的重要手段。近期在scheduler-perf基准测试中，PreemptionPVs测试用例出现了性能不达标的情况。这个问题出现在SchedulerPopFromBackoffQ和SchedulerAsyncPreemption两个特性同时启用的场景下。

问题现象

PreemptionPVs测试用例测量的是调度器在处理持久卷(Persistent Volume)抢占场景下的吞吐量。测试结果显示，当同时启用上述两个特性时，调度吞吐量低于预期阈值。值得注意的是，其他抢占测试用例并未受到影响。

深入分析

通过对比不同特性组合下的测试数据，我们发现了一个有趣的现象：

当两个特性都启用时，调度过程明显加快，大多数Pod在最后一秒内完成调度
测试工具会忽略第一个和最后一个不完整的测量秒数
由于调度速度过快，主要调度活动集中在被忽略的最后一秒

具体数据对比显示：

特性全开时，前几秒仅调度少量Pod(20-40个)，最后一秒完成大部分调度
特性关闭时，调度过程更均匀地分布在多个秒数内

技术原理

这个问题揭示了两个重要特性对调度性能的实际影响：

SchedulerAsyncPreemption特性：通过异步抢占机制显著减少了抢占操作的时间
SchedulerPopFromBackoffQ特性：允许Pod直接从退避队列中取出，避免了等待退避时间

这两个特性的组合使得抢占操作变得异常高效，反而导致测试工具无法准确测量真实的调度吞吐量。

解决方案

经过讨论，社区提出了几种可能的解决方案：

增加测试Pod数量：延长调度时间，使调度活动分布在多个测量秒数内
修改测试工具：允许测量不完整的最后一个秒数
创建专用测试用例：为异步抢占场景设计专门的测试用例

目前采取的临时方案是移除该测试的吞吐量阈值要求，待代码冻结期过后再进行更彻底的解决方案。

经验总结

这个案例为我们提供了宝贵的经验：

性能测试工具需要与时俱进，适应核心特性的改进
过快的性能提升可能导致测试方法失效
在评估系统性能时，需要考虑测量工具本身的局限性

对于Kubernetes开发者而言，这提醒我们在引入性能优化特性时，需要同步考虑其对测试体系的影响，确保能够准确评估真实的性能改进。

Production-Grade Container Scheduling and Management

项目地址：https://gitcode.com/GitHub_Trending/kuber/kubernetes

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。