Aim项目中S3存储客户端的自定义配置实践

2025-06-06 16:15:26作者：韦蓉瑛

背景介绍

在机器学习实验管理工具Aim中，S3ArtifactStorage是用于将实验数据存储到S3兼容存储的核心组件。默认情况下，它使用boto3库与S3服务交互，但原生实现仅支持通过环境变量配置有限的连接参数，这在实际企业环境中往往不能满足需求。

问题分析

许多企业使用自建的S3兼容存储解决方案（如VAST S3等），这些方案通常需要特定的连接配置：

自定义端点URL
直接指定访问凭证而非通过环境变量
网络中转设置
SSL/TLS配置
其他boto3客户端支持的高级参数

传统配置方式存在以下局限：

无法通过环境变量设置端点URL
全局Session配置会影响应用其他部分的S3连接
配置文件方式不够灵活，难以动态调整

解决方案设计

我们通过扩展S3ArtifactStorage类实现了更灵活的配置方式：

核心思路

创建可配置的S3ArtifactStorage子类
重写_get_s3_client()方法以支持自定义参数
提供工厂方法简化配置过程
保持原有URI模式兼容性

实现要点

class S3ArtifactStorageCustom(S3ArtifactStorage):
    def __init__(self, **client_kwargs):
        self._client_kwargs = client_kwargs
        super().__init__()
    
    def _get_s3_client(self):
        return boto3.client('s3', **self._client_kwargs)

使用方式

from aim import Run
from aim.storage.artifacts.s3_storage import S3ArtifactStorage_clientconfig

# 配置自定义客户端参数
S3ArtifactStorage_clientconfig(
    endpoint_url='http://internal.storage.example',
    aws_access_key_id='access_key',
    aws_secret_access_key='secret_key',
    config={'network_settings': {'http': 'gateway.example:8080'}}
)

# 正常使用Aim的存储功能
run = Run()
run.set_artifacts_uri('s3://my-bucket/experiments')
run.log_artifact('model.pt')