KServe项目中使用Raw Deployment模式部署Sklearn模型的问题解析

2025-06-16 22:08:36作者：谭伦延

问题背景

在使用KServe项目部署机器学习模型服务时，开发者可以选择两种不同的部署模式：Knative Serving和Raw Deployment。最近有开发者在尝试使用Raw Deployment模式部署Sklearn模型时遇到了无法正常进行推理的问题。

开发者按照官方文档的指引，在本地部署了KServe环境后，创建了一个Sklearn模型的服务。当使用Knative Serving作为后端服务时，推理请求能够正常工作。然而，当切换到Raw Deployment模式时，发送推理请求却返回404错误。

经过深入排查，发现问题的根源在于Raw Deployment模式下缺少必要的Ingress配置。与Knative Serving不同，Raw Deployment模式不会自动创建Istio相关的网络资源，而是依赖于Kubernetes原生的Ingress机制来处理网络流量。

要解决这个问题，需要手动创建一个IngressClass资源。具体配置如下：

apiVersion: networking.k8s.io/v1
kind: IngressClass
metadata:
  name: istio
spec:
  controller: istio.io/ingress-controller

这个配置明确指定了使用Istio作为Ingress控制器，使得KServe在Raw Deployment模式下能够正确处理外部请求。

Raw Deployment模式与Knative Serving模式的主要区别在于：

资源管理方式：Raw Deployment直接使用Kubernetes原生的Deployment资源，而Knative Serving使用其特有的自动扩缩容机制。
网络层处理：Knative Serving会自动配置Istio VirtualService等资源，而Raw Deployment需要显式配置Ingress规则。
适用场景：Raw Deployment更适合需要精细控制底层资源的场景，而Knative Serving更适合需要自动扩缩容的无服务器场景。

对于使用Raw Deployment模式的开发者，建议：

KServe社区正在积极推动Gateway API的集成工作，这将为Raw Deployment模式提供更加强大和灵活的网络功能。Gateway API相比传统Ingress提供了更丰富的路由规则和流量管理能力，能够更好地满足生产环境的需求。

通过本文的分析，开发者可以更好地理解KServe中不同部署模式的特点和配置要求，避免在实际使用中遇到类似问题。

登录后查看全文