ZenML 0.82.0版本发布：Kubernetes编排器增强与文档全面升级

2025-06-12 11:52:59作者：韦蓉瑛

项目简介

ZenML是一个开源的机器学习运维(MLOps)框架，旨在简化和标准化机器学习工作流程的构建和部署过程。它提供了统一的接口来管理机器学习管道中的各个组件，包括数据处理、模型训练、评估和部署等环节。通过抽象底层基础设施的复杂性，ZenML让数据科学家和工程师能够更专注于模型开发本身。

核心特性解析

Kubernetes编排器功能增强

本次0.82.0版本对Kubernetes编排器进行了多项重要改进：

并行度控制：新增了max parallelism选项，允许用户精确控制Kubernetes集群中同时运行的Pod数量。这一功能对于资源有限的集群特别有用，可以避免资源耗尽的情况发生。
Pod命名定制：现在可以指定Pod名称前缀，使得在Kubernetes集群中更容易识别和管理ZenML创建的Pod资源。
调度器配置：增加了对Kubernetes调度器的配置支持，用户可以根据需要调整调度策略，优化资源利用率。

运行管理优化

超时配置简化：改进了runner的超时配置机制，使得设置和管理运行超时变得更加直观和便捷。
运行状态深度刷新：在仪表板中新增了深度刷新运行状态的功能，用户可以手动触发以获取最新的运行状态信息。
Python包管理：新增了对Python包列表的存储支持，有助于更好地跟踪和管理依赖关系。

Vertex AI集成改进

针对Google Vertex AI编排器，增加了私有服务连接(Private Service Connect)的支持选项，这增强了在受限制网络环境中的部署能力，提高了安全性。

技术实现细节

构建系统改进

Dockerfile变更检测：现在当父Dockerfile发生变化时，能够正确地使构建缓存失效，确保使用最新的基础镜像。
代码下载处理：改进了代码下载过程中的目录处理逻辑，避免了因目录已存在而导致的问题。

数据与模型管理

模型版本灵活性：现在可以列出没有关联具体模型的模型版本，提供了更大的灵活性。
额外属性支持：所有ZenML模型现在都支持额外的属性，这使得扩展功能变得更加容易。
Pandas数据类型处理：增强了Pandas自定义数据类型的错误处理和日志记录，提高了调试效率。

兼容性与稳定性

NumPy兼容性：更新了NumPy集成，使其能够同时支持1.x和2.x版本的库。
依赖清理：移除了sklearn集成中不必要的scikit-image依赖，简化了安装过程。
设置清理：移除了多个不必要和无效的设置项，简化了配置。

文档全面升级

本次版本对文档进行了全面重构和优化：

内容重组：重新组织了文档结构，使其更加清晰和易于导航。
自托管运行模板：新增了关于自托管运行模板的详细文档。
示例更新：更新了所有示例和指南，确保与最新API保持一致。
图像优化：优化了ZenML管道的截图路径和显示效果。

升级建议

对于现有用户，升级到0.82.0版本时需要注意以下几点：

如果使用了sklearn集成，需要确保不再依赖scikit-image功能。
对于Kubernetes编排器用户，新的并行度控制功能可能需要调整现有配置。
建议在升级前备份重要数据和配置。

总结

ZenML 0.82.0版本通过增强Kubernetes编排能力、改进运行管理和优化文档，进一步巩固了其作为MLOps解决方案的地位。这些改进不仅提升了系统的稳定性和性能，也大大改善了用户体验。特别是对Kubernetes和Vertex AI集成的增强，使得在生产环境中部署和管理机器学习工作流变得更加灵活和可靠。

zenml

ZenML 🙏: One AI Platform from Pipelines to Agents. https://zenml.io.

项目地址：https://gitcode.com/GitHub_Trending/ze/zenml

登录后查看全文