AWS SDK Java v2 S3Client.getObject方法响应流异常问题解析

2025-07-02 00:13:46作者：裘旻烁

问题背景

在AWS SDK Java v2的2.30.x版本中，开发者报告了一个关于S3Client.getObject方法返回的ResponseInputStream包含异常数据的问题。当从S3下载一个仅包含"abc"字符串的对象时，实际获取的响应流中包含了额外的元数据和校验信息，而非预期的纯净内容。

问题现象

在2.30.0至2.30.3版本中，调用getObject方法后，通过readAllBytes读取的字节流不仅包含对象内容"abc"，还包含了以下额外信息：

表示块大小的数字"3"
表示块结束的标记"0"
校验和头部"x-amz-checksum-crc32:NSRBwg=="
额外的空行

这种异常行为在2.29.x版本中并不存在，属于版本升级后引入的回归问题。

技术分析

此问题源于2.30.0版本引入的校验和计算与验证机制。AWS SDK Java v2在该版本中默认启用了请求校验和计算与响应校验和验证功能，这是为了提高数据传输的完整性保障。

当这些校验功能启用时，SDK会在传输过程中：

对上传的数据自动计算校验和
对下载的数据自动验证校验和
在传输过程中使用分块编码机制
在响应流中包含校验和相关信息

解决方案

对于需要保持旧版本行为的场景，特别是与LocalStack等第三方服务集成时，可以通过以下配置禁用自动校验功能：

S3Client s3Client = S3Client.builder()
    .endpointOverride(URI.create("http://localhost:4566"))
    .serviceConfiguration(S3Configuration.builder()
        .pathStyleAccessEnabled(true)
        .build())
    .responseChecksumValidation(ResponseChecksumValidation.WHEN_REQUIRED)
    .requestChecksumCalculation(RequestChecksumCalculation.WHEN_REQUIRED)
    .build();

将responseChecksumValidation和requestChecksumCalculation都设置为WHEN_REQUIRED后，SDK将仅在明确要求时执行校验操作，从而恢复与2.29.x版本相同的行为。