Requests库中503状态码重试机制问题解析

2025-04-30 07:13:50作者：田桥桑Industrious

用Python轻松发送HTTP请求，试试Requests库吧！它优雅简洁，自动化处理查询字符串、数据编码，甚至支持JSON。已有数百万开发者信赖Requests，每周下载量高达3000万次。兼容Python 3.8+，具备连接池、TLS验证、多种认证方式等功能。无论是国际域名还是文件上传，Requests都游刃有余。立即安装，体验高效稳定的HTTP编程！

项目地址：https://gitcode.com/gh_mirrors/req/requests

问题背景

在使用Python的Requests库进行HTTP请求时，开发者可能会遇到一个特殊现象：当服务器返回503状态码时，即使配置了有限次数的重试策略，请求也会无限重试，而不是按照预期在达到最大重试次数后抛出异常。

问题重现

通过以下代码可以重现这个问题：

import requests
from requests.adapters import HTTPAdapter, Retry

url = "https://www.floraquatic.com/363-eau-de-mer-et-recifal"

session = requests.Session()
    
retry_strategy = Retry(total=3, backoff_factor=0.5, status_forcelist=[429, 500, 502, 504])

adapter = HTTPAdapter(max_retries=retry_strategy)

session.mount("https://", adapter)

try:
    response = session.get(url)
    html_content = response.text
except Exception as e:
    print(str(e))

问题原因分析

这个问题的根本原因在于服务器响应中包含了Retry-After头部字段。当服务器返回503状态码时，通常会附带这个头部，指示客户端应该等待多长时间后再重试请求。

Requests库底层使用的urllib3库默认会尊重这个头部字段（respect_retry_after_header=True）。这意味着：

当服务器返回503并带有Retry-After头部时
urllib3会按照服务器指示的等待时间进行延迟
这种延迟不计入配置的重试次数(total参数)
因此请求会无限期重试，而不是在达到最大重试次数后停止

解决方案

要解决这个问题，可以通过以下两种方式：

方法一：禁用Retry-After头部处理

retry_strategy = Retry(
    total=3, 
    backoff_factor=0.5, 
    status_forcelist=[429, 500, 502, 503, 504],
    respect_retry_after_header=False
)

这种方法直接告诉urllib3忽略服务器的Retry-After指示，完全按照配置的重试策略执行。

方法二：捕获特定异常

from urllib3.exceptions import MaxRetryError

try:
    response = session.get(url)
    html_content = response.text
except MaxRetryError as e:
    print(f"达到最大重试次数: {e}")
except Exception as e:
    print(str(e))