MLRun v1.8.0-rc54版本发布：模型监控与数据管理能力升级

2025-07-01 09:36:16作者：翟江哲Frasier

项目简介

MLRun是一个开源的机器学习运维(MLOps)平台，它提供了端到端的机器学习管道管理能力，从数据准备、模型训练到部署和监控。作为一个强大的MLOps框架，MLRun帮助数据科学家和工程师简化机器学习工作流程，提高模型开发和部署的效率。

本次发布的v1.8.0-rc54版本在模型监控方面进行了多项重要改进：

多工作者写入支持：模型监控组件现在支持配置多个写入工作者，这显著提高了高并发场景下的数据处理能力。通过并行处理监控数据，系统可以更高效地处理大规模模型预测结果的实时分析。
灵活的指标查询：新增了对TSDB(时间序列数据库)指标的选择性查询支持。用户现在可以指定需要返回的具体监控指标列表，而不是获取所有指标数据。这一改进不仅减少了网络传输量，也提高了查询效率，特别适合需要频繁获取特定指标的场景。
参数命名规范化：对模型监控接口的查询参数名称进行了标准化调整，使其更符合行业惯例和REST API设计规范。这一改进提高了API的一致性和易用性，开发者可以更直观地理解和使用这些接口。

在数据管理方面，本次版本修复了一个重要的排序问题：

修复了在同时使用partition_by和limit参数时，Artifact列表排序可能出错的问题。这一改进确保了在复杂查询条件下，数据检索结果的准确性和一致性，特别是在需要分页显示的场景下。

通知系统改进：修复了Webhook通知中日期时间序列化的问题。现在系统能够正确地将Python的datetime对象转换为JSON格式，确保时间信息在通知消息中准确传递。
日志级别调整：降低了Nuclio组件中invoke操作的日志级别，从信息级(info)调整为调试级(debug)。这一变更减少了生产环境中的日志噪音，使关键日志信息更加突出。

本次版本更新体现了MLRun项目在以下几个方面的技术演进：

这个版本特别适合以下应用场景：

MLRun v1.8.0-rc54版本在模型监控能力和系统稳定性方面做出了重要改进，进一步巩固了其作为专业MLOps平台的地位。这些更新不仅提升了系统的性能和可靠性，也改善了开发者体验，为构建健壮的机器学习运维体系提供了更强大的支持。对于正在使用或考虑采用MLRun的团队，这个版本值得关注和评估。

登录后查看全文