Moto项目中的S3多部分上传覆盖问题解析

2025-05-29 08:17:10作者：裴麒琰

问题背景

在Moto项目的最新版本5.0.23中，开发人员发现了一个关于Amazon S3模拟服务的严重行为变更。当使用多部分上传(Multipart Upload)方式尝试覆盖已存在的对象时，操作会静默失败，而不会像预期那样覆盖原有对象内容。这一问题在5.0.22版本及之前的版本中并不存在，也与AWS S3的实际行为不符。

技术细节分析

多部分上传是S3提供的一种大文件上传机制，允许将大文件分割成多个部分分别上传，最后通过完成上传操作将这些部分合并成一个完整的对象。在Moto 5.0.23版本中，实现这一功能的_key_response_post方法引入了一个针对existing.multipart的检查逻辑，导致当尝试覆盖已存在的多部分上传对象时，系统错误地保留了原有对象而非执行覆盖操作。

问题复现与验证

通过以下Python代码可以清晰地复现这一问题：

import io
import boto3
from moto import mock_aws

def test_multipart_upload_overwrite():
    with mock_aws():
        s3_client = boto3.client("s3", region_name="eu-west-1")
        bucket_name = "test-bucket"
        key = "test-key"

        # 创建测试桶
        s3_client.create_bucket(
            Bucket=bucket_name,
            CreateBucketConfiguration={"LocationConstraint": "eu-west-1"},
        )

        # 第一次多部分上传
        upload_id = s3_client.create_multipart_upload(Bucket=bucket_name, Key=key)["UploadId"]
        part_data = b"First part data"
        response = s3_client.upload_part(
            Bucket=bucket_name,
            Key=key,
            PartNumber=1,
            UploadId=upload_id,
            Body=io.BytesIO(part_data),
        )
        s3_client.complete_multipart_upload(
            Bucket=bucket_name,
            Key=key,
            UploadId=upload_id,
            MultipartUpload={"Parts": [{"PartNumber": 1, "ETag": response["ETag"]}]},
        )

        # 尝试覆盖同一key
        upload_id = s3_client.create_multipart_upload(Bucket=bucket_name, Key=key)["UploadId"]
        new_data = b"New data that should overwrite"
        response = s3_client.upload_part(
            Bucket=bucket_name,
            Key=key,
            PartNumber=1,
            UploadId=upload_id,
            Body=io.BytesIO(new_data),
        )
        s3_client.complete_multipart_upload(
            Bucket=bucket_name,
            Key=key,
            UploadId=upload_id,
            MultipartUpload={"Parts": [{"PartNumber": 1, "ETag": response["ETag"]}]},
        )

        # 验证内容是否被覆盖
        result = s3_client.get_object(Bucket=bucket_name, Key=key)
        content = result["Body"].read()
        assert content == new_data  # 在5.0.23版本中此断言会失败