首页
/ 在Solo.io Gloo中实现OpenTelemetry分布式追踪

在Solo.io Gloo中实现OpenTelemetry分布式追踪

2025-06-12 05:03:57作者:胡易黎Nicole

概述

在现代微服务架构中,分布式追踪是理解请求在系统中流转路径的关键技术。本文将详细介绍如何在Solo.io Gloo API网关中集成OpenTelemetry(OTel)实现分布式追踪功能,帮助开发者获得请求在网关和下游服务间的完整调用链路。

OpenTelemetry简介

OpenTelemetry是一套开源的观测性框架,提供了统一的协议和工具集来收集、处理和导出遥测数据。与传统的Zipkin、Jaeger等单一解决方案相比,OTel的主要优势在于:

  1. 标准化协议:统一了追踪数据的格式和传输方式
  2. 多语言支持:提供多种编程语言的SDK实现
  3. 可扩展性:支持多种后端存储和分析系统
  4. 全栈观测:不仅支持追踪,还支持指标和日志的收集

环境准备

在开始配置前,请确保:

  1. 已部署Gloo Gateway 1.13.0或更高版本
  2. 拥有集群的管理权限
  3. 了解基本的Kubernetes操作

部署OpenTelemetry Collector

OTel Collector是数据处理的核心组件,负责接收、处理和导出追踪数据。在Gloo中部署OTel Collector的步骤如下:

  1. 创建OTel Collector配置,包含以下关键部分:

    • Receivers:定义数据接收协议(gRPC/HTTP)
    • Exporters:配置数据导出目标(如Zipkin)
    • Processors:可选的数据处理环节
    • Service:将上述组件串联起来
  2. 部署OTel Collector到集群:

    kubectl apply -n gloo-system -f otel-config.yaml
    
  3. 验证部署状态:

    kubectl get pods -n gloo-system
    

    应该能看到otel-agent和otel-collector的Pod处于Running状态。

配置Zipkin可视化

Zipkin是一个流行的分布式追踪系统,我们将使用它来可视化追踪数据:

  1. 部署Zipkin服务:
    kubectl -n gloo-system create deployment --image openzipkin/zipkin zipkin
    kubectl -n gloo-system expose deployments/zipkin --port 9411 --target-port 9411
    

配置Gloo Gateway集成

要使Gloo Gateway将追踪数据发送到OTel Collector,需要进行以下配置:

  1. 创建OTel Collector的上游定义:

    apiVersion: gloo.solo.io/v1
    kind: Upstream
    metadata:
      name: "opentelemetry-collector"
      namespace: gloo-system
    spec:
      useHttp2: true  # OTel Collector使用HTTP/2协议
      static:
        hosts:
          - addr: "otel-collector"
            port: 4317
    
  2. 修改Gateway配置启用OTel追踪:

    apiVersion: gateway.solo.io/v1
    kind: Gateway
    metadata:
      name: gateway-proxy
      namespace: gloo-system
    spec:
      httpGateway:
        options:
          httpConnectionManagerSettings:
            tracing:
              openTelemetryConfig:
                collectorUpstreamRef:
                  namespace: "gloo-system"
                  name: "opentelemetry-collector"
    
  3. 创建测试用的VirtualService:

    apiVersion: gateway.solo.io/v1
    kind: VirtualService
    metadata:
      name: default
      namespace: gloo-system
    spec:
      virtualHost:
        domains: ['*']
        routes:
          - matchers: [{ prefix: / }]
            directResponseAction:
              status: 200
              body: 'hello world'
    

验证追踪功能

完成配置后,可以通过以下步骤验证追踪是否正常工作:

  1. 端口转发服务:

    kubectl -n gloo-system port-forward deployments/gateway-proxy 8080
    kubectl -n gloo-system port-forward deployments/zipkin 9411
    
  2. 发送测试请求:

    curl http://localhost:8080
    
  3. 查看OTel Collector日志:

    kubectl -n gloo-system logs deployments/otel-collector -f
    

    应该能看到包含请求详情的追踪数据。

  4. 访问Zipkin界面(http://localhost:9411)查看可视化追踪。

高级配置:自定义Span名称

默认情况下,Gloo会为每个请求生成标准的Span名称。如果需要自定义,可以通过Transformation Filter实现:

apiVersion: gateway.solo.io/v1
kind: VirtualService
metadata:
  name: default
  namespace: gloo-system
spec:
  virtualHost:
    options:
      stagedTransformations:
        regular:
          requestTransforms:
            - requestTransformation:
                transformationTemplate:
                  spanTransformer:
                    name:
                      text: '{{header("Host")}}'  # 使用Host头作为Span名称

也可以为特定路由设置静态描述符:

routes:
- matchers:
   - prefix: /special-route
  options:
    tracing:
      routeDescriptor: "SPECIAL_ROUTE"

状态码处理说明

根据OpenTelemetry语义约定:

  • 1xx/2xx/3xx状态码:Span状态保持未设置(Unset)
  • 4xx/5xx状态码:Span状态标记为错误(Error)

可以通过修改VirtualService中的响应状态码来观察这一行为变化。

总结

通过本文的配置,我们成功在Solo.io Gloo中实现了:

  1. OpenTelemetry Collector的部署
  2. 追踪数据的收集和导出
  3. Zipkin可视化界面的集成
  4. 自定义Span名称的高级功能

这套方案为微服务架构提供了强大的可观测性支持,帮助开发者快速定位和解决分布式系统中的问题。

登录后查看全文
热门项目推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
262
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
863
511
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
596
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K