BentoML与Keras模型保存问题的解决方案

2025-05-29 03:16:07作者：袁立春Spencer

问题背景

在使用BentoML框架保存Keras模型时，开发者可能会遇到一个常见错误：ValueError提示"signatures"和"options"参数不被支持。这个问题通常出现在BentoML 1.2.9版本与Keras 3.1.1/TensorFlow 2.16.1组合使用时。

问题分析

当开发者尝试使用bentoml.keras.save_model()方法保存Keras模型时，框架内部会调用Keras的model.save()方法。但在某些版本组合下，BentoML会默认传递一些Keras当前版本不支持的参数（如signatures和options），导致保存失败。

解决方案

方案一：使用MLFlow作为中间层

目前最可靠的解决方案是采用MLFlow作为模型保存的中间层，然后再通过BentoML导入MLFlow模型：

设置MLFlow环境

import mlflow
mlflow.set_tracking_uri("your_mlflow_server_uri")
mlflow.set_experiment("your_experiment_name")

保存模型到MLFlow

with mlflow.start_run():
    # 训练模型代码...
    mlflow.keras.log_model(
        model,
        artifact_path="model_name",
        registered_model_name="registered_name"
    )

导入到BentoML

import bentoml
bentoml.mlflow.import_model(
    "your_bento_model_name",
    model_uri="mlflow_model_uri",
    signatures={"predict": {"batchable": False}}
)

方案二：版本降级

如果必须直接使用Keras集成，可以尝试将BentoML降级到1.1.11版本，这个版本在某些场景下表现更稳定：

pip install bentoml==1.1.11

服务部署

模型成功保存后，可以创建BentoML服务：

from bentoml.io import JSON, Text
import pandas as pd

model_ref = bentoml.mlflow.get("your_model_name:latest")
runner = model_ref.to_runner()

svc = bentoml.Service(
    name="your_service_name",
    runners=[runner]
)

@svc.api(input=Text(), output=JSON())
async def predict(input_data):
    # 处理输入数据
    result = await runner.async_run(processed_data)
    return {"result": result}

最佳实践建议

对于生产环境，推荐使用MLFlow作为模型管理中间件，它提供了更完善的模型版本控制和实验跟踪功能。
在模型开发阶段就考虑好部署需求，确保训练环境和部署环境的一致性。
对于复杂的自定义模型，可以通过custom_objects参数传递自定义层和指标函数。
定期检查BentoML和Keras/TensorFlow的版本兼容性，特别是大版本更新时。

通过上述方法，开发者可以绕过直接保存Keras模型时遇到的问题，同时获得更强大的模型管理能力。这种架构也使得模型从开发到部署的流程更加标准化和可维护。

BentoML

The easiest way to serve AI apps and models - Build Model Inference APIs, Job queues, LLM apps, Multi-model pipelines, and more!

项目地址：https://gitcode.com/gh_mirrors/be/BentoML

登录后查看全文