MLflow 项目中使用 MinIO 存储时垃圾回收失败问题分析

2025-05-10 11:59:23作者：侯霆垣

问题背景

在 MLflow 项目中，当使用 MinIO 作为 artifacts 存储后端并启用了 artifact proxying 功能时，执行 mlflow gc 命令进行垃圾回收会遇到失败情况。该问题表现为系统无法正确列出和删除 artifacts，导致垃圾回收功能失效。

问题根源

经过深入分析，发现问题出在 S3 存储路径处理逻辑上。具体表现为：

路径拼接问题：MLflow 在构建 S3 存储路径时，会在路径末尾添加了双斜杠("//")，这在基于文件系统的 MinIO 存储后端中被视为非法字符。
MinIO 特殊性：与标准 S3 服务不同，MinIO 构建在文件系统存储后端之上，对路径命名有更严格的限制，特别是不能使用多余的"/"字符作为路径分隔符。
错误表现：当 MLflow 尝试列出 artifacts 时，会收到 MinIO 返回的 XMinioInvalidObjectName 错误，提示"Object name contains unsupported characters"。

技术细节

问题主要出现在 mlflow/store/artifact/s3_artifact_repo.py 文件中的两个方法：

list_artifacts 方法：在构建 S3 查询前缀(prefix)时，没有正确处理路径末尾的斜杠。
delete_artifacts 方法：同样存在路径拼接问题，导致无法正确构建删除操作所需的前缀。

解决方案

通过以下代码修改可以解决该问题：

# 在构建目标路径后添加路径清理逻辑
dest_path = dest_path.rstrip("/") if dest_path else ""

这一修改确保了：

在构建 S3 查询前缀前，先清理路径末尾多余的斜杠
保持了原有功能的语义不变
兼容了 MinIO 的路径命名规则

影响范围

该问题影响以下 MLflow 功能组件：

垃圾回收(mlflow gc)功能
使用 MinIO 作为存储后端的 artifact 管理功能
启用了 artifact proxying 的 MLflow 跟踪服务器

最佳实践建议

对于使用 MinIO 作为 MLflow 存储后端的用户，建议：

及时应用该修复补丁
在部署前测试垃圾回收功能
监控 artifact 存储使用情况，避免因垃圾回收失败导致存储空间不足
考虑定期手动清理不再需要的 artifacts

总结

该问题的解决体现了 MLflow 项目对多样化存储后端的良好支持能力。通过简单的路径处理逻辑调整，即可解决与 MinIO 存储的兼容性问题，展现了 MLflow 架构的灵活性和可扩展性。对于企业用户而言，这一修复确保了在混合云环境下使用 MinIO 作为 MLflow 存储后端的可靠性。

mlflow

项目地址：https://gitcode.com/GitHub_Trending/ml/mlflow

登录后查看全文

项目优选

收起

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openGauss kernel ~ openGauss is an open source relational database management system

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

258

298

ShopXO开源商城

🔥🔥🔥ShopXO企业级免费开源商城系统，可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存，遵循MIT开源协议发布、基于ThinkPHP8框架研发

JavaScript

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

本仓将收集和展示仓颉鸿蒙应用示例代码，欢迎大家投稿，在仓颉鸿蒙社区展现你的妙趣设计！

一款跨平台的 Markdown AI 笔记软件，致力于使用 AI 建立记录和写作的桥梁。

TSX

CangjieCommunity

为仓颉编程语言开发者打造活跃、开放、高质量的社区环境

MLflow 项目中使用 MinIO 存储时垃圾回收失败问题分析

问题背景

问题根源

技术细节

解决方案

影响范围

最佳实践建议

总结

热门内容推荐

最新内容推荐

项目优选

MLflow 项目中使用 MinIO 存储时垃圾回收失败问题分析

问题背景

问题根源

技术细节

解决方案

影响范围

最佳实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选