KEDA 使用 AWS Secrets Manager 认证问题的分析与解决

2025-05-26 05:29:36作者：蔡怀权

问题背景

在使用 KEDA 2.14.0 版本与 Kubernetes 1.29 集群时，开发团队遇到了一个关于 AWS Secrets Manager 认证的问题。具体表现为 KEDA 的 TriggerAuth 资源无法正确读取 AWS Secrets Manager 中存储的密钥，尽管配置了正确的 secretName 和 secret 参数。

问题现象

团队配置了一个 TriggerAuthentication 资源，希望通过 AWS Secrets Manager 获取 Kafka 连接所需的认证凭证。配置如下：

apiVersion: v1
kind: TriggerAuthentication
metadata:
  name: test-triggerauth
  namespace: my-microservice-namespace
spec:
  awsSecretManager:
    podIdentity:
      provider: aws
      roleArn: arn:aws:iam::<accountId>:test-role/<test-role-ID>
    region: us-east-1
    secrets:
    - name: service/test-svc/svc-api-key-path
      parameter: api-key
    - name: service/test-svc/svc-api-key-path
      parameter: api-secret

目标 Secrets Manager 中的密钥格式为 JSON 结构：

{
  "api-key":"MY-SECRET-KEY",
  "api-secret":"MY-SECRET--VAL"
}

错误表现

KEDA 操作日志显示认证参数解析失败，具体错误为 Kafka 客户端无法连接到代理。虽然错误表面上是连接问题，但根本原因在于认证凭据未能正确获取。

排查过程

验证密钥存在性：确认密钥确实存在于指定的 AWS 区域和 Secrets Manager 中
检查 IAM 权限：验证了 KEDA 操作员使用的 IAM 角色具有访问 Secrets Manager 的权限
检查环境变量：确认 KEDA 操作员 Pod 中已正确设置 AWS 相关环境变量
检查网络连接：排除了网络连接问题导致的可能性

解决方案

团队最终通过以下方式解决了问题：

使用 Secrets Store CSI 驱动：配置了一个 AWS Secrets Provider Class 来从 Secrets Manager 读取密钥
动态创建 Kubernetes Secret：让 CSI 驱动自动创建标准的 Kubernetes Secret 资源
改用 ClusterTriggerAuth：使用 ClusterTriggerAuth 资源来引用这些动态创建的 Secret

这种解决方案的优势在于：