Mozilla SOPS v3.9.2 Azure Key Vault 解密失败问题分析

2025-05-12 17:41:59作者：秋阔奎Evelyn

问题背景

Mozilla SOPS 是一款流行的密钥管理工具，用于安全地存储和管理敏感数据。在 v3.9.2 版本发布后，用户报告在使用 Azure Key Vault 进行解密操作时遇到了问题。具体表现为解密失败，并显示与 Azure 身份验证相关的错误信息。

问题现象

当用户尝试使用 SOPS v3.9.2 解密文件时，系统返回以下错误：

DefaultAzureCredential: failed to acquire a token.
Attempted credentials:
    EnvironmentCredential: missing environment variable AZURE_TENANT_ID
    WorkloadIdentityCredential: no client ID specified
    ManagedIdentityCredential: managed identity timed out
    AzureCLICredential isn't configured to acquire tokens for tenant

值得注意的是，v3.9.1 版本仍能正常工作，这表明问题是在 v3.9.2 中引入的。

根本原因分析

经过深入调查，发现问题源于 Azure SDK 的版本升级。具体来说：

SOPS v3.9.2 将 Azure SDK 从以下版本升级：
- github.com/Azure/azure-sdk-for-go/sdk/security/keyvault/azkeys 从 v1.1.0 升级到 v1.3.0
- github.com/Azure/azure-sdk-for-go/sdk/azcore 从 v1.13.0 升级到 v1.16.0
新版本的 Azure SDK 引入了更严格的租户验证机制，要求显式配置允许的租户列表。
默认情况下，AzureCLICredential 现在会检查请求的租户是否在允许的租户列表中，而不再自动允许所有租户。

临时解决方案

在等待官方修复期间，用户可以采取以下临时解决方案：

设置环境变量：
```
export AZURE_ADDITIONALLY_ALLOWED_TENANTS=*
```
这将允许访问任何 Azure 租户，恢复到类似旧版本的行为。
降级到 v3.9.1 版本，该版本不受此问题影响。

官方修复

Mozilla SOPS 团队迅速响应了这个问题：

在后续版本中升级了 github.com/Azure/azure-sdk-for-go/sdk/azidentity 到 v1.8.1，该版本包含了 Azure SDK 团队的相关修复。
发布了 v3.9.4 版本，该版本完全解决了这个问题，用户无需再设置额外的环境变量。

技术细节

这个问题涉及到 Azure 身份验证流程的几个关键方面：

DefaultAzureCredential：这是 Azure SDK 提供的默认凭据链，会尝试多种身份验证方式，包括环境变量、托管身份和 Azure CLI 等。
多租户支持：在企业环境中，一个应用程序可能需要访问多个 Azure 租户的资源。新版本的 SDK 加强了对这种场景的安全控制。
身份验证链：当一种身份验证方式失败时，SDK 会自动尝试下一种方式，直到成功或所有方式都尝试完毕。