KServe 0.14版本多进程工作模式失效问题分析

2025-06-15 11:13:20作者：申梦珏Efrain

在KServe 0.14版本中，用户报告了一个关于多进程工作模式的重要功能退化问题。本文将深入分析该问题的技术背景、产生原因以及解决方案。

问题现象

当用户在KServe 0.14版本的InferenceService配置中指定了多个工作进程（如通过--workers 19参数）时，系统实际上只启动了一个工作进程。这与0.13版本的行为形成了鲜明对比，在0.13版本中，系统能够正确启动指定数量的工作进程。

KServe是一个用于部署机器学习模型的Kubernetes原生框架。在模型服务过程中，为了提高并发处理能力，通常会采用多进程模式。在Python生态中，Uvicorn是一个常用的ASGI服务器实现，支持多进程工作模式。

经过分析，问题的根本原因在于KServe 0.14版本对Uvicorn的调用方式发生了改变：

关键问题在于，Uvicorn的设计并不支持通过Config对象传递workers参数来启动多进程。这是Uvicorn的一个已知限制，其多进程模式需要通过命令行参数或直接调用接口来指定。

该问题影响了所有使用KServe 0.14版本并期望通过--workers参数配置多进程工作模式的用户。特别是在需要高并发处理推理请求的场景下，单进程模式会成为性能瓶颈。

KServe开发团队已经确认了这个问题，并正在为0.14版本准备修复补丁。可能的修复方向包括：

对于当前遇到此问题的用户，临时解决方案可以考虑：

在配置KServe工作进程时，建议：

这个问题提醒我们，在框架升级过程中，即使是看似简单的参数传递方式改变，也可能导致重要功能的退化。作为用户，在升级后进行全面功能验证是非常必要的。

登录后查看全文