AWS Amplify S3 文件上传随机失败问题分析与解决方案

2025-05-25 01:04:09作者：明树来

项目地址：https://gitcode.com/gh_mirrors/aw/aws-amplify

问题背景

在使用 AWS Amplify 的 Storage 模块进行 S3 文件上传时，开发者可能会遇到随机上传失败的问题。这些失败表现为网络连接中断（ERR_CONNECTION_RESET）或请求无响应，且错误发生时请求甚至没有到达 S3 端点。

问题现象

主要症状包括：

上传过程中随机出现网络错误
浏览器控制台显示"Network Error - Failed to load resource: The network connection was lost"或"ERR_CONNECTION_RESET"
错误源自 xhr-http-handler，但没有更详细的错误信息
S3 访问日志中没有记录失败的请求

根本原因分析

经过深入调查，发现问题的核心在于：

网络连接不稳定导致上传过程中断
Amplify 的默认重试机制对某些网络错误（如 ERR_CONNECTION_RESET、ERR_NO_RESPONSE 和 503 SLOWDOWN）处理不足
缺乏适当的退避重试策略

技术解决方案

官方修复方案

AWS Amplify 团队在 v6.6.7 版本中修复了重试机制的问题。升级到此版本后，系统能够更可靠地处理上传过程中的网络错误。

自定义重试策略

在官方修复前，开发者可以采用以下自定义重试策略：

export const wrapRetry = async <T>(
  fn: (..._any: any[]) => Promise<T>,
  maxAttempts: number,
  backoffFunction: (attemptNumber: number) => number
) => {
  for (let attempt = 0; attempt < maxAttempts; attempt++) {
    try {
      await new Promise((resolve) => {
        return setTimeout(resolve, backoffFunction(attempt))
      })

      return await fn()
    } catch (err: any) {
      if (attempt === maxAttempts - 1) {
        throw err
      }
      
      // 400和403错误不应重试
      if (err.httpStatusCode === 400 || err.httpStatusCode === 403) {
        throw err
      }
      console.info(`Attempt ${attempt + 1} failed. Retrying...`)
    }
  }

  throw new Error('Maximum number of attempts exceeded.')
}