KubeAI v0.13.0 发布：优化路由与扩展服务支持

2025-07-08 03:16:35作者：毕习沙Eudora

KubeAI 是一个专注于在 Kubernetes 集群上部署和管理 AI 工作负载的开源项目。它简化了大规模 AI 模型的部署流程，提供了高效的资源管理和调度能力，特别适合需要处理复杂 AI 推理任务的企业和研究机构。

核心特性更新

1. 缓存优化路由与负载均衡

本次版本引入了"PrefixHash"负载均衡策略（也称为 Consistent Hash With Bounded Loads，CHWBL）。这项技术通过以下方式显著提升了系统性能：

会话一致性：确保相同前缀的请求总是路由到同一后端实例，这对于需要维持会话状态的AI推理任务尤为重要
负载均衡：在保证一致性的同时，智能分配请求以避免单个节点过载
资源利用率：通过基准测试显示，在8个H100 GPU上部署Llama 3.1 70B模型时，系统吞吐量提升了约30%

2. 服务类型扩展支持

新增了对NodePort和LoadBalancer服务类型的支持，为不同部署场景提供了更多灵活性：

NodePort：适合本地开发测试环境，通过节点端口直接暴露服务
LoadBalancer：适用于云环境，自动配置云提供商负载均衡器
自定义端口：管理员现在可以指定服务暴露的端口号，满足企业安全策略要求

技术组件升级

项目核心组件vLLM GPU镜像已升级至v0.6.6.post1版本，该版本包含：

性能优化：改进了内存管理和批处理效率
稳定性增强：修复了多个边缘情况下的崩溃问题
新模型支持：扩展了对最新开源大语言模型的兼容性

部署与管理改进

Helm chart版本和应用版本同步更新，确保部署的一致性和可追溯性。更新后的chart包含：

简化的values.yaml配置结构
更详细的部署文档说明
自动化的版本检查机制

实际应用场景

这些更新特别适合以下场景：

多租户AI服务：通过优化的路由策略，可以为不同客户提供稳定的服务质量保证
大规模模型推理：负载均衡改进使得部署70B参数级别的大模型更加可靠
混合云部署：新增的服务类型支持简化了跨环境部署的复杂度

升级建议

对于现有用户，建议按照以下步骤进行升级：

备份当前配置和模型数据
检查Kubernetes集群资源是否满足新版本要求
通过Helm执行滚动更新，监控服务稳定性
利用新路由特性优化现有工作负载配置

KubeAI v0.13.0的这些改进标志着项目在生产就绪性方面又迈出了重要一步，为企业在Kubernetes上运行关键AI业务提供了更强大的基础设施支持。

kubeai

Lightweight ML model proxy and autoscaler for kubernetes

项目地址：https://gitcode.com/gh_mirrors/lingo/kubeai

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

KubeAI v0.13.0 发布：优化路由与扩展服务支持

核心特性更新

1. 缓存优化路由与负载均衡

2. 服务类型扩展支持

技术组件升级

部署与管理改进

实际应用场景

升级建议

热门内容推荐

最新内容推荐

项目优选

KubeAI v0.13.0 发布：优化路由与扩展服务支持

核心特性更新

1. 缓存优化路由与负载均衡

2. 服务类型扩展支持

技术组件升级

部署与管理改进

实际应用场景

升级建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选