Crossplane在EKS环境中函数调用失败的排查与解决

2025-05-23 21:19:44作者：傅爽业Veleda

在Kubernetes生态系统中，Crossplane作为一款强大的云原生控制平面工具，其函数(Function)功能为资源编排提供了灵活的可编程能力。然而在实际部署过程中，特别是在AWS EKS这样的托管Kubernetes环境中，用户可能会遇到函数调用失败的问题。

问题现象

当用户尝试在EKS集群中使用Crossplane的函数功能时，发现资源编排流程无法正常执行。具体表现为Composite资源的状态中显示如下错误信息：

cannot compose resources: cannot run Composition pipeline step "patch-and-transform": 
cannot run Function "function-patch-and-transform": 
rpc error: code = Unavailable desc = last resolver error: produced zero addresses

这个错误表明Crossplane无法解析函数服务的地址，导致gRPC调用失败。

根本原因分析

经过深入排查，发现问题源于EKS环境中特殊的网络配置要求。在AWS EKS环境中，许多用户出于网络策略或安全考虑，会为Crossplane部署设置hostNetwork: true。这种配置虽然解决了webhook等组件的网络访问问题，但却带来了DNS解析方面的副作用。

关键点在于：

当Pod使用hostNetwork: true时，默认的dnsPolicy: ClusterFirst将不再适用
Kubernetes的DNS解析机制依赖于/etc/resolv.conf中配置的搜索域
在hostNetwork模式下，默认配置会丢失对svc.cluster.local等Kubernetes内部域名的解析能力

解决方案

针对这一问题，最有效的解决方案是调整Crossplane部署的DNS策略：

确保Crossplane部署配置中包含：

dnsPolicy: ClusterFirstWithHostNet

这一配置将保证：

保持hostNetwork的网络模式优势
同时保留对Kubernetes内部服务名的解析能力
使得Crossplane能够正确解析函数服务的FQDN（完全限定域名）

技术原理深入

在Kubernetes中，DNS解析策略有几种关键模式：

ClusterFirst：默认策略，优先使用集群DNS解析
Default：继承节点本身的DNS配置
ClusterFirstWithHostNet：专为hostNetwork模式设计，在保持主机网络的同时支持集群DNS

当使用hostNetwork时，Pod实际上共享了节点的网络命名空间。如果不特别指定ClusterFirstWithHostNet，Pod将无法利用Kubernetes内置的DNS服务来解析集群内部的服务名称。

最佳实践建议

对于在EKS或其他托管Kubernetes服务上部署Crossplane的用户，建议：

始终为使用hostNetwork的Crossplane部署配置dnsPolicy: ClusterFirstWithHostNet
在部署前验证DNS解析能力，可以使用工具如dig或nslookup测试服务发现
考虑使用FQDN（完全限定域名）来减少对搜索域的依赖
定期检查Kubernetes的DNS服务状态，确保其健康运行

通过正确配置DNS策略，可以确保Crossplane的函数功能在各类Kubernetes环境中稳定运行，充分发挥其强大的资源编排能力。

crossplane

The Cloud Native Control Plane

项目地址：https://gitcode.com/gh_mirrors/cr/crossplane

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

515

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

284

Crossplane在EKS环境中函数调用失败的排查与解决

问题现象

根本原因分析

解决方案

技术原理深入

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

Crossplane在EKS环境中函数调用失败的排查与解决

问题现象

根本原因分析

解决方案

技术原理深入

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选