Kubeflow KFServing日志功能在非Knative环境下的配置与使用

2025-06-16 00:27:52作者：邵娇湘

概述

KFServing作为Kubeflow生态中的模型服务组件，提供了强大的日志功能，可以将模型预测的请求和响应记录到指定的日志收集服务中。本文将详细介绍如何在非Knative环境下配置和使用KFServing的日志功能，包括常见问题排查和最佳实践。

日志功能架构

KFServing的日志功能通过在模型服务Pod中注入一个sidecar容器来实现。这个sidecar容器会监听模型服务的请求和响应，并将它们转发到配置的日志收集服务。整个架构不依赖于Knative，可以独立工作。

配置步骤

1. 部署日志收集服务

首先需要部署一个日志收集服务，例如简单的HTTP服务：

from flask import Flask, request

app = Flask(__name__)

@app.route('/', methods=['POST'])
def log_request():
    # 打印请求头信息
    metadata_headers = ["x-request-id", "x-b3-traceid", "x-b3-spanid", "x-b3-flags"]
    print("Received Request:")
    for header in metadata_headers:
        value = request.headers.get(header, "Not provided")
        print(f"{header}: {value}")

    # 打印请求体
    print("Payload:")
    print(request.data.decode('utf-8'))
    return "Logged", 200

2. 配置InferenceService

在InferenceService的predictor部分添加logger配置：

apiVersion: serving.kserve.io/v1beta1
kind: InferenceService
metadata:
  name: sklearn
spec:
  predictor:
    logger:
      mode: all
      url: http://message-dumper/
    model:
      modelFormat:
        name: sklearn
      storageUri: gs://kfserving-examples/models/sklearn/1.0/model

关键配置说明

logger.mode: 可以设置为all(记录请求和响应)、request(仅记录请求)或response(仅记录响应)
logger.url: 日志收集服务的地址，格式为http://<service-name>.<namespace>，如果服务在同一命名空间下可以简写为http://<service-name>