Envoy go-control-plane多路由配置超时问题分析与解决方案

2025-07-10 14:26:02作者：郜逊炳

问题背景

在使用Envoy go-control-plane实现动态配置时，开发人员遇到了一个典型的路由配置问题。当尝试创建多个RouteConfiguration资源时，Envoy侧出现了gRPC配置初始化超时错误，控制平面缓存中未能正确生成dynamic_route_configs。而单一RouteConfiguration配置时则工作正常。

问题现象

具体表现为：

当部署超过1个RouteConfiguration时，Envoy日志报错："gRPC config: initial fetch timed out for type.googleapis.com/envoy.config.route.v3.RouteConfiguration"
通过admin接口检查发现dynamic_route_configs为null
问题仅出现在多路由配置场景，单路由配置工作正常

技术分析

配置生成机制

在示例代码中，开发人员通过makeRoute函数创建了多个独立的路由配置：

ro = append(ro, makeRoute("local_route_loc_req", d.Cluster.Prefix, d.ServiceName))
ro = append(ro, makeRoute("forward_proxy_route_stream", d.Cluster.Prefix, dynamicForwardProxyCluster))

这种实现方式会产生两个独立的RouteConfiguration资源，每个包含自己的VirtualHost和路由规则。这种设计在理论上是可行的，但在实际与Envoy交互时可能出现兼容性问题。

根本原因

经过分析，问题的本质在于：

Envoy对多RouteConfiguration的处理机制可能存在特殊要求
控制平面在生成配置快照时，多个RouteConfiguration可能导致资源冲突
配置传播时可能存在顺序依赖，导致部分配置未能及时生效

解决方案

最佳实践

正确的实现方式是将所有虚拟主机和路由规则整合到同一个RouteConfiguration实例中：

func makeCombinedRoute() *route.RouteConfiguration {
    return &route.RouteConfiguration{
        Name: "combined_routes",
        VirtualHosts: []*route.VirtualHost{
            // 第一个虚拟主机配置
            {
                Name:    "local_route",
                Domains: []string{"*"},
                Routes:  [...] // 本地路由规则
            },
            // 第二个虚拟主机配置 
            {
                Name:    "proxy_route",
                Domains: []string{"*"},
                Routes:  [...] // 代理路由规则
            },
        },
    }
}