Kubeflow KFServing中ARM64架构存储初始化镜像缺失问题分析

2025-06-15 17:50:54作者：段琳惟

KServe是基于Kubernetes的先进机器学习模型服务框架，它简化了预测与生成模型的部署和管理，兼容TensorFlow、XGBoost等主流框架。此平台通过自动缩放、健康检查等特性，无缝集成GPU支持，实现零规模扩展及金丝雀发布等高级功能。无论是预处理、后处理还是模型解释，KServe提供了一站式解决方案，支持高度可插拔性和云无关性，极大促进了模型上线的便利性和生产环境的适应性。适用于追求高可伸缩性和智能化路由的企业级应用。加入KServe社区，探索如何利用这一强大工具推动您的AI模型高效服务于实际业务。

项目地址：https://gitcode.com/gh_mirrors/kf/kfserving

问题背景

在Kubeflow KFServing项目的最新版本v0.15.0中，使用Mac M2（ARM64架构）设备的开发者遇到了一个关键问题。当他们在minikube Kubernetes集群上部署推理服务时，存储初始化容器无法正常启动，报错显示无法执行initializer-entrypoint脚本。

问题现象

开发者部署推理服务后，通过查看Pod日志发现storage-initializer容器启动失败，具体错误信息为"exec format error"。这表明容器内的可执行文件格式与宿主机的CPU架构不兼容。经过检查确认，KFServing v0.15.0版本确实没有提供ARM64架构的storage-initializer镜像。

技术分析

架构兼容性问题

在容器化环境中，当容器镜像的构建架构与运行环境的主机架构不匹配时，就会出现此类"exec format error"错误。Mac M2使用的是ARM64架构处理器，而默认提供的storage-initializer镜像可能只支持x86_64架构。

历史变更

根据项目开发历史记录，ARM64架构的构建支持在某个提交中被移除了。这一变更主要是由于ARM构建在持续集成(CI)过程中引发了诸多问题，经常阻塞正常的拉取请求(PR)流程。开发团队权衡后决定暂时移除ARM支持以保证主要功能的正常发布。

临时解决方案

对于急需在ARM64设备上使用KFServing的开发者，可以采用以下临时方案：

自行构建ARM64版本的storage-initializer镜像
通过ClusterStorageConfig配置项指定自定义镜像的位置

未来展望

项目维护团队已经意识到这个问题的重要性，并计划在下一个版本v0.15.1中恢复对ARM64架构的支持。同时团队也在积极调查和解决CI系统中的构建问题，以确保多架构构建的稳定性。

建议

对于生产环境中的ARM64架构部署，建议：

密切关注项目更新，及时升级到支持ARM64的版本
在过渡期，可以维护自己的ARM64镜像仓库
参与社区讨论，共同完善多架构支持

这个问题反映了开源项目在多平台支持上的挑战，也展示了社区响应和解决问题的典型流程。随着ARM架构在个人电脑和服务器领域的普及，相信KFServing项目会持续改进其多架构支持能力。

KServe是基于Kubernetes的先进机器学习模型服务框架，它简化了预测与生成模型的部署和管理，兼容TensorFlow、XGBoost等主流框架。此平台通过自动缩放、健康检查等特性，无缝集成GPU支持，实现零规模扩展及金丝雀发布等高级功能。无论是预处理、后处理还是模型解释，KServe提供了一站式解决方案，支持高度可插拔性和云无关性，极大促进了模型上线的便利性和生产环境的适应性。适用于追求高可伸缩性和智能化路由的企业级应用。加入KServe社区，探索如何利用这一强大工具推动您的AI模型高效服务于实际业务。

项目地址：https://gitcode.com/gh_mirrors/kf/kfserving

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统