BentoML与Keras 3.x模型保存加载兼容性问题解析

2025-05-29 10:00:03作者：晏闻田Solitary

Build Production-Grade AI Applications

项目地址：https://gitcode.com/gh_mirrors/be/BentoML

在深度学习模型部署领域，BentoML作为一个优秀的模型服务化框架，提供了对多种深度学习框架的支持。然而，随着Keras 3.x的发布，其模型保存和加载机制发生了重大变化，这直接影响了BentoML中Keras模型的保存和加载功能。

问题背景

Keras 3.x于2023年11月28日发布，引入了全新的模型保存格式要求。与之前版本不同，Keras 3.x强制要求模型保存路径必须以.keras为扩展名，或者使用传统的.h5格式。这一变化导致BentoML现有的Keras模型保存机制失效，因为BentoML采用的是目录保存方式而非单一文件。

技术细节分析

Keras 3.x的模型保存机制变化主要体现在以下几个方面：

文件格式要求：必须明确指定.keras或.h5扩展名
存储结构：.keras实际上是一个压缩包格式，包含模型结构和权重
兼容性考虑：保留了传统HDF5格式支持

在BentoML的实现中，模型保存时会将相关文件存储在一个目录中，这与Keras 3.x的新要求直接冲突，导致保存操作失败并抛出异常。

解决方案

Keras团队在3.4.0版本(2024年6月25日发布)中引入了一个新的zipped参数，允许恢复旧版的行为模式。这个参数可以用于恢复与BentoML的兼容性。

具体实现上，BentoML可以通过以下方式适配：

在保存模型时，明确指定.keras扩展名
利用zipped=True参数保持向后兼容
确保加载时也能正确处理新的模型格式

影响范围

这一问题影响所有使用以下组合的用户：

BentoML 1.3.2及更早版本
Keras 3.x系列
TensorFlow 2.17及更高版本(因其依赖Keras 3.5.0)

最佳实践建议

对于需要使用BentoML部署Keras模型的开发者，建议：

升级到支持Keras 3.x的BentoML版本
明确模型保存格式要求
在自定义层和预处理函数时，确保正确声明custom_objects
测试模型保存和加载的完整流程

总结

框架间的兼容性问题在深度学习生态系统中时有发生。BentoML与Keras 3.x的这次兼容性问题提醒我们，在升级关键依赖时需要全面测试模型生命周期的各个环节。通过理解底层机制的变化，开发者可以更好地应对这类兼容性挑战，确保模型从训练到部署的顺畅过渡。

Build Production-Grade AI Applications

项目地址：https://gitcode.com/gh_mirrors/be/BentoML

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理