Knative Serving中实现自定义指标与缩容至零的探索

2025-06-06 15:40:07作者：温玫谨Lighthearted

Kubernetes-based, scale-to-zero, request-driven compute

项目地址：https://gitcode.com/gh_mirrors/ser/serving

在云原生应用开发中，Knative Serving作为一款优秀的Serverless框架，其自动扩缩容能力一直是开发者关注的焦点。本文将深入探讨如何在Knative Serving中同时实现自定义指标(如CPU)的自动扩缩容和缩容至零(scale to zero)的功能。

Knative自动扩缩容机制现状

Knative Serving提供了两种主要的自动扩缩容机制：

KPA(Knative Pod Autoscaler)：这是Knative原生的自动扩缩容器，支持缩容至零功能，但不支持基于CPU等自定义指标的扩缩容。
HPA(Horizontal Pod Autoscaler)：这是Kubernetes标准的自动扩缩容机制，支持CPU等自定义指标，但不支持缩容至零功能。

这种设计上的分离导致开发者面临一个两难选择：要么选择缩容至零但放弃自定义指标，要么选择自定义指标但放弃缩容至零。

技术解决方案探索

KEDA集成方案

社区中已经出现了一个名为autoscaler-keda的扩展项目，它尝试将KEDA(Kubernetes Event-driven Autoscaling)集成到Knative Serving中。KEDA是一个Kubernetes的自动扩缩容器，它有两个显著特点：

支持缩容至零
支持丰富的自定义指标

通过这个扩展，Knative Serving可以获得以下能力：

保留原有的缩容至零功能
新增对CPU等自定义指标的支持
扩展支持更多类型的事件驱动指标

实现原理

autoscaler-keda扩展的工作原理是替换Knative Serving中的HPA实现，转而使用KEDA作为底层扩缩容引擎。这种替换是透明的，上层应用仍然使用Knative的标准API和配置方式。

值得注意的是，这个扩展目前处于Alpha阶段，生产环境使用前需要充分测试。它主要替换HPA部分，而KPA部分仍然保持独立运行。

实际应用考量

在实际部署时，开发者需要注意以下几点：

避免控制器冲突：不应同时使用KPA和KEDA控制同一个工作负载，这会导致扩缩容策略冲突。
指标兼容性：确保自定义指标的定义方式与KEDA兼容，可能需要调整现有的监控体系。
性能影响：评估KEDA引入后对系统整体性能的影响，特别是在大规模集群中。
功能取舍：虽然KEDA提供了丰富的功能，但可能需要放弃一些Knative原生扩缩容器的特性。

未来展望

随着Serverless技术的演进，Knative Serving的自动扩缩容能力将持续增强。社区正在探索的方向包括：

统一扩缩容接口，简化配置
增强指标采集和分析能力
优化冷启动性能
提供更智能的预测性扩缩容

对于需要同时使用自定义指标和缩容至零功能的团队，autoscaler-keda扩展提供了一个可行的过渡方案，值得在测试环境中验证和评估。

Kubernetes-based, scale-to-zero, request-driven compute

项目地址：https://gitcode.com/gh_mirrors/ser/serving

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

AtomGit CLI （ag cli），AtomGit 命令行工具，参考 GitHub CLI (gh) 开发。目前 atomgit-cli 项目已在 AtomCode 的 Coding Plan 项目列表中

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook