MLRun v1.8.0-rc25版本发布：模型监控与向量数据库能力升级

2025-07-01 03:58:01作者：曹令琨Iris

MLRun is an open source MLOps platform for quickly building and managing continuous ML applications across their lifecycle. MLRun integrates into your development and CI/CD environment and automates the delivery of production data, ML pipelines, and online applications.

项目地址：https://gitcode.com/gh_mirrors/ml/mlrun

MLRun是一个开源的机器学习平台，旨在简化机器学习工作流程的构建、部署和管理。作为数据科学家和机器学习工程师的强大工具，MLRun提供了从数据准备到模型部署的全生命周期管理能力。

本次发布的v1.8.0-rc25版本带来了多项重要改进，特别是在模型监控和向量数据库功能方面有显著增强。作为候选发布版本，它已经具备了生产环境使用的基本条件，但仍在进行最后的测试和优化。

核心功能增强

在模型监控方面，本次更新解决了多个关键问题。Kafka流处理的分片函数(sharding_func)得到了修正，确保了大规模模型监控场景下的数据处理稳定性。同时，批量漂移测试(batch_drift)和应用评估系统测试也得到了修复，提升了模型监控系统的可靠性。

向量数据库功能是本版本的另一个重点改进领域。开发团队优化了与MongoDB的集成，现在使用原生的delete操作替代了之前的Langchain实现，提高了文档删除操作的效率。此外，文档加载器规范(DocumentLoaderSpec)中的下载对象(download_object)现在会被持久化存储，避免了重复下载的开销。对于V3IO存储，默认配置增加了"document"前缀，使命名更加规范。

安全性与兼容性提升

安全方面，Golang组件中的多个问题得到了修复，进一步提升了系统的安全性。Python 3.11现在也被纳入持续集成(CI)测试范围，确保MLRun能够兼容最新的Python版本。

项目密钥管理功能得到了改进，现在支持不经过大写转换或添加前缀直接挂载项目密钥，为开发者提供了更大的灵活性。这一变化特别适合需要保持密钥原始格式的特殊场景。

告警系统优化

告警功能在本版本中获得了两项重要改进。首先是新增了获取单个告警激活状态的API接口，使得用户可以更精确地查询特定告警的状态。其次，系统现在能够支持未来可能添加的schema字段，为后续功能扩展奠定了基础。对于旧版本客户端，更新字段(updated field)会被自动从响应中排除，确保了向后兼容性。