KServe在RawDeployment模式下使用Kong Ingress Gateway的配置问题解析

2025-06-15 05:44:20作者：何举烈Damon

KServe是基于Kubernetes的先进机器学习模型服务框架，它简化了预测与生成模型的部署和管理，兼容TensorFlow、XGBoost等主流框架。此平台通过自动缩放、健康检查等特性，无缝集成GPU支持，实现零规模扩展及金丝雀发布等高级功能。无论是预处理、后处理还是模型解释，KServe提供了一站式解决方案，支持高度可插拔性和云无关性，极大促进了模型上线的便利性和生产环境的适应性。适用于追求高可伸缩性和智能化路由的企业级应用。加入KServe社区，探索如何利用这一强大工具推动您的AI模型高效服务于实际业务。

项目地址：https://gitcode.com/gh_mirrors/kf/kfserving

背景介绍

KServe作为Kubernetes上的机器学习服务框架，提供了多种部署模式。其中RawDeployment模式允许用户直接使用原生Kubernetes资源进行模型部署。当结合Kong Ingress Gateway使用时，用户期望能够自动创建网关实例Pod和LoadBalancer服务，但在实际配置过程中可能会遇到一些问题。

问题现象

在KServe v0.14.1版本中，用户尝试通过Helm配置使用Kong作为Ingress Gateway时发现：

按照文档配置后，系统未自动创建预期的网关实例Pod和LoadBalancer服务
手动创建Gateway资源时遇到"unknown field 'spec.infrastructure'"错误
删除infrastructure节点后Gateway创建成功，但仍未生成预期的网关资源

根本原因分析

经过深入分析，发现以下关键点：

版本兼容性问题：Gateway API支持功能是在KServe v0.15.0rc0版本才引入的，v0.14.1版本并不完全支持相关配置
资源配置差异：Kong Gateway API的实现与标准Gateway API规范存在差异，特别是对infrastructure字段的处理
控制器行为：在RawDeployment模式下，KServe不会自动管理网关基础设施的完整生命周期

解决方案

针对这一问题，建议采取以下解决步骤：

升级KServe版本：确保使用v0.15.0或更高版本，以获得完整的Gateway API支持

正确配置GatewayClass：

apiVersion: gateway.networking.k8s.io/v1
kind: GatewayClass
metadata:
  name: kong
spec:
  controllerName: konghq.com/kic-gateway-controller

简化Gateway资源配置：

apiVersion: gateway.networking.k8s.io/v1
kind: Gateway
metadata:
  name: kserve-ingress-gateway
  namespace: kserve
spec:
  gatewayClassName: kong
  listeners:
  - name: proxy
    port: 80
    protocol: HTTP
    allowedRoutes:
      namespaces:
        from: All