首页
/ 在Solo.io Gloo中实现OpenTelemetry分布式追踪

在Solo.io Gloo中实现OpenTelemetry分布式追踪

2025-06-12 05:03:57作者:胡易黎Nicole

概述

在现代微服务架构中,分布式追踪是理解请求在系统中流转路径的关键技术。本文将详细介绍如何在Solo.io Gloo API网关中集成OpenTelemetry(OTel)实现分布式追踪功能,帮助开发者获得请求在网关和下游服务间的完整调用链路。

OpenTelemetry简介

OpenTelemetry是一套开源的观测性框架,提供了统一的协议和工具集来收集、处理和导出遥测数据。与传统的Zipkin、Jaeger等单一解决方案相比,OTel的主要优势在于:

  1. 标准化协议:统一了追踪数据的格式和传输方式
  2. 多语言支持:提供多种编程语言的SDK实现
  3. 可扩展性:支持多种后端存储和分析系统
  4. 全栈观测:不仅支持追踪,还支持指标和日志的收集

环境准备

在开始配置前,请确保:

  1. 已部署Gloo Gateway 1.13.0或更高版本
  2. 拥有集群的管理权限
  3. 了解基本的Kubernetes操作

部署OpenTelemetry Collector

OTel Collector是数据处理的核心组件,负责接收、处理和导出追踪数据。在Gloo中部署OTel Collector的步骤如下:

  1. 创建OTel Collector配置,包含以下关键部分:

    • Receivers:定义数据接收协议(gRPC/HTTP)
    • Exporters:配置数据导出目标(如Zipkin)
    • Processors:可选的数据处理环节
    • Service:将上述组件串联起来
  2. 部署OTel Collector到集群:

    kubectl apply -n gloo-system -f otel-config.yaml
    
  3. 验证部署状态:

    kubectl get pods -n gloo-system
    

    应该能看到otel-agent和otel-collector的Pod处于Running状态。

配置Zipkin可视化

Zipkin是一个流行的分布式追踪系统,我们将使用它来可视化追踪数据:

  1. 部署Zipkin服务:
    kubectl -n gloo-system create deployment --image openzipkin/zipkin zipkin
    kubectl -n gloo-system expose deployments/zipkin --port 9411 --target-port 9411
    

配置Gloo Gateway集成

要使Gloo Gateway将追踪数据发送到OTel Collector,需要进行以下配置:

  1. 创建OTel Collector的上游定义:

    apiVersion: gloo.solo.io/v1
    kind: Upstream
    metadata:
      name: "opentelemetry-collector"
      namespace: gloo-system
    spec:
      useHttp2: true  # OTel Collector使用HTTP/2协议
      static:
        hosts:
          - addr: "otel-collector"
            port: 4317
    
  2. 修改Gateway配置启用OTel追踪:

    apiVersion: gateway.solo.io/v1
    kind: Gateway
    metadata:
      name: gateway-proxy
      namespace: gloo-system
    spec:
      httpGateway:
        options:
          httpConnectionManagerSettings:
            tracing:
              openTelemetryConfig:
                collectorUpstreamRef:
                  namespace: "gloo-system"
                  name: "opentelemetry-collector"
    
  3. 创建测试用的VirtualService:

    apiVersion: gateway.solo.io/v1
    kind: VirtualService
    metadata:
      name: default
      namespace: gloo-system
    spec:
      virtualHost:
        domains: ['*']
        routes:
          - matchers: [{ prefix: / }]
            directResponseAction:
              status: 200
              body: 'hello world'
    

验证追踪功能

完成配置后,可以通过以下步骤验证追踪是否正常工作:

  1. 端口转发服务:

    kubectl -n gloo-system port-forward deployments/gateway-proxy 8080
    kubectl -n gloo-system port-forward deployments/zipkin 9411
    
  2. 发送测试请求:

    curl http://localhost:8080
    
  3. 查看OTel Collector日志:

    kubectl -n gloo-system logs deployments/otel-collector -f
    

    应该能看到包含请求详情的追踪数据。

  4. 访问Zipkin界面(http://localhost:9411)查看可视化追踪。

高级配置:自定义Span名称

默认情况下,Gloo会为每个请求生成标准的Span名称。如果需要自定义,可以通过Transformation Filter实现:

apiVersion: gateway.solo.io/v1
kind: VirtualService
metadata:
  name: default
  namespace: gloo-system
spec:
  virtualHost:
    options:
      stagedTransformations:
        regular:
          requestTransforms:
            - requestTransformation:
                transformationTemplate:
                  spanTransformer:
                    name:
                      text: '{{header("Host")}}'  # 使用Host头作为Span名称

也可以为特定路由设置静态描述符:

routes:
- matchers:
   - prefix: /special-route
  options:
    tracing:
      routeDescriptor: "SPECIAL_ROUTE"

状态码处理说明

根据OpenTelemetry语义约定:

  • 1xx/2xx/3xx状态码:Span状态保持未设置(Unset)
  • 4xx/5xx状态码:Span状态标记为错误(Error)

可以通过修改VirtualService中的响应状态码来观察这一行为变化。

总结

通过本文的配置,我们成功在Solo.io Gloo中实现了:

  1. OpenTelemetry Collector的部署
  2. 追踪数据的收集和导出
  3. Zipkin可视化界面的集成
  4. 自定义Span名称的高级功能

这套方案为微服务架构提供了强大的可观测性支持,帮助开发者快速定位和解决分布式系统中的问题。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
139
1.91 K
kernelkernel
deepin linux kernel
C
22
6
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
192
273
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
923
551
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
421
392
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
145
189
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Jupyter Notebook
74
64
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
344
1.3 K
easy-eseasy-es
Elasticsearch 国内Top1 elasticsearch搜索引擎框架es ORM框架,索引全自动智能托管,如丝般顺滑,与Mybatis-plus一致的API,屏蔽语言差异,开发者只需要会MySQL语法即可完成对Es的相关操作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo,嵌套,父子类型等功能...
Java
36
8