MLRun v1.8.0 发布：模型监控正式发布与AI全生命周期管理增强

2025-07-01 16:26:44作者：瞿蔚英Wynne

Machine Learning automation and tracking

项目地址：https://gitcode.com/gh_mirrors/ml/mlrun

MLRun 是一个开源的机器学习运维（MLOps）平台，旨在简化和加速机器学习项目的全生命周期管理。从数据准备、模型训练到部署和监控，MLRun 提供了一套完整的工具链，帮助数据科学家和工程师更高效地构建和运维机器学习应用。

模型监控功能正式发布

MLRun v1.8.0 版本最重大的更新是模型监控（Model Monitoring）功能的正式发布（GA）。这一功能需要 Nuclio>=1.13.12 支持，且与之前版本不兼容。对于正在使用 v1.7.x 版本的用户，升级前需要特别注意：

升级前可选择性重新部署所有监控的服务函数，设置 set_tracking(False)
运行 project.disable_model_monitoring 命令删除所有监控应用、基础设施pod和数据流
升级完成后，可以像往常一样开始使用模型监控功能

新版本在模型监控方面有多项增强：

支持大规模运行，利用MLRun的额外副本/工作者提高处理能力
新增文档型模型的实验跟踪功能，通过新的 DocumentArtifact 类型管理LangChain文档
提供测试模型功能，可在部署前运行和评估模型，节省时间和资源
支持为模型端点自定义名称
简化了创建模型监控告警的SDK接口

告警与通知系统改进

告警功能现在默认启用，并新增了告警激活历史记录功能。用户可以通过SDK列出告警激活历史，并支持多种参数过滤。在通知方面，新增了邮件通知功能，进一步丰富了通知渠道。

运行时与基础设施优化

在运行时方面，add_model 和 add_route 方法新增了 creation_strategy 参数，用于定义端点的创建或更新策略。基础设施方面，MLRun 现在支持 Confluent Kafka 7.8，同时KFP不再包含在MLRun基础镜像中，而是提供了专门的 mlrun/mlrun-kfp 镜像，解决了依赖冲突问题。

用户体验提升

UI方面有多项改进：

项目主页的主要计数器现在可点击，取代了"查看全部"链接
新增工作流重试功能，保持相同的实验ID重新运行
跨项目视图显示项目内的告警激活数量
查询实现分页，提高响应速度
作业和工作流监控界面采用弹出式过滤器，优化空间利用
特征存储界面同样采用弹出式过滤器，提升用户体验

文档与教程更新

新增了"使用向量数据库进行实验跟踪"教程，详细介绍了如何利用MLRun管理文档型模型。同时新增了"本地与远程工作流"说明文档，帮助用户理解不同环境下的工作流执行差异。

问题修复与性能优化

v1.8.0版本修复了多个问题，包括：

大YAML文件查看优化
非调度pod的错误信息改进
项目获取artifact功能修复
模型监控应用内存泄漏修复
标签验证增强
Docker Registry变更时的密钥使用问题
通知发送机制优化
非root用户构建镜像问题修复
工作流中artifact标签问题修复
多个artifact标记为latest的问题解决
性能优化减少超时导致的worker重启
模型监控应用中服务函数响应不匹配问题修复
通知卡在"Pending"状态问题解决

MLRun v1.8.0 通过模型监控功能的正式发布和多项增强，进一步巩固了其作为全生命周期MLOps平台的地位，为机器学习项目的开发、部署和运维提供了更加强大和稳定的支持。

Machine Learning automation and tracking

项目地址：https://gitcode.com/gh_mirrors/ml/mlrun

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统