KEDA Temporal Scaler 在 Temporal Cloud 中使用 API Key 认证的 TLS 配置问题分析
问题背景
KEDA(Kubernetes Event-driven Autoscaling)是一个流行的 Kubernetes 事件驱动自动扩展组件,其中的 Temporal Scaler 用于根据 Temporal 工作流引擎中的任务队列长度来自动扩展工作节点。然而,当用户尝试将 Temporal Scaler 与 Temporal Cloud 服务配合使用时,发现了一个关键的身份验证问题。
问题现象
用户在使用 Temporal Cloud 的 API Key 认证方式时,KEDA 的 Temporal Scaler 无法正常工作,系统日志显示连接错误:"read: connection reset by peer"。经过分析,这是由于 Temporal Scaler 在与 Temporal Cloud 建立连接时没有正确启用 TLS 加密导致的。
技术分析
Temporal Cloud 的安全要求
Temporal Cloud 要求所有使用 API Key 认证的客户端连接都必须启用 TLS 加密。这是 Temporal Cloud 的安全策略之一,旨在确保所有通信都经过加密保护。
KEDA Temporal Scaler 的实现缺陷
在 KEDA 的 Temporal Scaler 实现中,当仅配置 API Key 认证时,代码没有自动启用 TLS 连接选项。这导致客户端尝试以明文方式连接 Temporal Cloud 服务,而服务器端由于安全策略会拒绝这种不安全的连接,从而产生"connection reset by peer"错误。
根本原因
查看 KEDA 源代码可以发现,Temporal Scaler 在处理 API Key 认证时,没有将 TLS 设置为默认启用状态。这与 Temporal Cloud 的安全要求相矛盾,导致了连接失败。
解决方案
临时解决方案
用户发现可以通过同时提供客户端证书的方式来强制启用 TLS 连接,即使不使用 mTLS(双向 TLS)认证:
- 使用 Temporal Cloud CLI 工具生成 CA 证书和客户端证书
- 将生成的客户端证书和私钥进行 Base64 编码
- 将这些凭证添加到 Kubernetes Secret 中
- 在 TriggerAuthentication 中同时配置 apiKey、cert 和 key 参数
这种方法虽然可行,但增加了不必要的证书管理复杂度。
理想解决方案
从技术实现角度,KEDA Temporal Scaler 应该进行以下改进:
- 当检测到使用 Temporal Cloud 端点(包含 .temporal.io 域名)时,自动启用 TLS
- 对于 API Key 认证方式,强制要求 TLS 连接
- 提供明确的错误提示,指导用户正确配置 TLS
最佳实践建议
对于需要在生产环境中使用 KEDA Temporal Scaler 与 Temporal Cloud 集成的用户,建议:
- 始终为 Temporal Cloud 连接启用 TLS
- 定期轮换 API Key 和证书
- 监控连接状态和自动扩展指标
- 保持 KEDA 组件更新,以获取最新的安全修复和功能改进
总结
这个问题凸显了在云服务集成中安全配置的重要性。KEDA 作为连接 Kubernetes 和外部系统的桥梁,需要特别注意各种云服务的特定安全要求。开发者在使用类似集成时,应当仔细阅读目标服务的文档,了解其安全模型和连接要求,以避免类似的连接问题。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust098- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00