AWS SDK Rust 在 Docker 容器中加载配置卡顿问题解析

2025-06-26 10:11:33作者：鲍丁臣Ursa

在使用 AWS SDK Rust 进行开发时，开发者可能会遇到一个特殊场景：当代码运行在 Docker 容器中时，配置加载过程会出现明显的延迟甚至卡死现象。这个问题看似简单，实则涉及 AWS SDK 的多个核心机制。

问题现象

在标准环境下，通过 aws_config::defaults().load() 加载配置通常能够瞬间完成。然而当同样的代码运行在特定 Docker 容器中时，会出现以下异常表现：

初始阶段，配置加载会固定延迟 1 秒后完成
经过几次成功连接后，最终会陷入完全卡死的状态
日志中会记录到对 169.254.169.254 地址的连接尝试

根本原因分析

这个问题的核心在于 AWS SDK Rust 的区域(Region)解析机制。SDK 会按照预设的优先级顺序尝试获取区域信息：

首先检查环境变量 AWS_REGION
然后查找 ~/.aws/config 配置文件
最后尝试通过 EC2 实例元数据服务(IMDS)获取

当容器环境中既没有设置区域环境变量，也不存在 AWS 配置文件时，SDK 就会尝试通过 IMDS 获取区域信息。而 IMDS 服务的默认地址正是 169.254.169.254。

在非 EC2 环境（如普通 Docker 容器）中，这个地址通常不可达，导致 SDK 在超时后才会继续后续流程。这就是造成 1 秒延迟的根本原因。

解决方案

针对这个问题，开发者可以采取以下几种解决方案：

1. 显式设置区域信息

最直接的方式是在代码中明确指定区域：

let config = aws_config::defaults()
    .region(Region::new("us-east-1"))
    .load()
    .await;

2. 提供配置文件

在容器中放置标准的 AWS 配置文件：

[default]
region = us-east-1

3. 禁用 IMDS 查询

通过环境变量禁用 IMDS 查询：

docker run -e AWS_EC2_METADATA_DISABLED=true ...

4. 自定义区域提供链

实现自定义的 ProvideRegion trait，完全控制区域解析逻辑：

struct CustomRegionProvider;
impl ProvideRegion for CustomRegionProvider {
    fn region(&self) -> Future<Region> {
        async { Ok(Region::new("us-east-1")) }.boxed()
    }
}

let config = aws_config::defaults()
    .region_provider(CustomRegionProvider)
    .load()
    .await;