Envoy Gateway v1.3.1 OpenTelemetry访问日志配置问题分析

2025-07-07 05:46:48作者：申梦珏Efrain

在Envoy Gateway v1.3.1版本中，当配置OpenTelemetry作为访问日志(access log)的输出目标时，会导致HTTP路由无法正确注册到代理监听器，从而使服务不可用。这个问题是由于OpenTelemetry配置处理逻辑中的缺陷导致的。

问题现象

升级到v1.3.1版本后，开发人员发现集群中的所有HTTPRoute都无法注册到代理监听器。通过检查Envoy代理的监听器和路由配置，确认配置的路由都没有被正确注册。服务访问时会出现SSL握手错误，因为请求无法被正确路由。

在Envoy日志中可以看到明确的错误信息："otel.Text is nil"，这表明OpenTelemetry配置处理过程中出现了空指针引用。当禁用OpenTelemetry日志接收器配置后，路由配置恢复正常，服务变得可用。

技术分析

这个问题源于xds-translator组件在转换访问日志配置时的处理逻辑缺陷。具体来说，在将OpenTelemetry配置转换为Envoy可理解的xDS格式时，代码没有正确处理Text格式字段的可选性，导致当该字段为空时抛出空指针异常。

在v1.3.1版本的代码中，访问日志转换器会强制检查OpenTelemetry配置的Text字段，而没有考虑该字段是可选的这一事实。当配置中只指定了JSON格式而没指定Text格式时，转换过程就会失败，进而导致整个xDS配置生成过程失败。

影响范围

这个问题影响所有使用以下配置模式的Envoy Gateway v1.3.1用户：

启用了访问日志功能
使用OpenTelemetry作为日志接收器之一
没有显式配置Text格式日志

解决方案

目前有两种临时解决方案：

降级回v1.3.0版本
暂时禁用OpenTelemetry日志接收器配置

Envoy Gateway团队已经将该问题标记为bug，并计划在v1.3.2和v1.2.8版本中修复。修复方式将包括正确处理OpenTelemetry配置中可选字段的情况，避免空指针异常。

最佳实践建议

对于生产环境，建议：

在升级前充分测试新版本的所有功能
监控Envoy代理的配置状态
考虑使用金丝雀发布策略逐步升级
保持对项目issue跟踪的关注，及时获取修复信息

这个问题提醒我们，即使是看似简单的日志配置变更，也可能对系统的核心路由功能产生重大影响。在微服务架构中，可观测性组件与核心路由组件的解耦程度需要特别关注。

gateway

Manages Envoy Proxy as a Standalone or Kubernetes-based Application Gateway

项目地址：https://gitcode.com/gh_mirrors/gate/gateway

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理