Kiali项目中Tempo集成时Span引用信息缺失问题分析
问题背景
在Kiali与分布式追踪系统Tempo集成时,发现了一个关于Span引用信息的技术问题。当使用Tempo作为外部追踪系统时,从Kiali API获取的Span对象中缺少References信息,而同样的配置下如果使用Jaeger端口则能正常显示这些引用关系。
技术现象
通过Kiali的API端点查询Span数据时,当配置使用Tempo原生端口3200并设置provider为tempo时,返回的Span对象中References数组为空。而当配置使用Jaeger端口16685时,相同的Span数据则包含完整的References信息。
根本原因分析
经过技术团队深入调查,发现这个问题源于Tempo查询机制与Jaeger的差异。Tempo的查询接口在设计上无法返回parentSpanId字段,而这个字段正是构建References数组的关键数据。References数组在分布式追踪中用于表示Span之间的父子关系或跟随关系。
在Kiali内部实现中,References信息是通过parentSpanId转换而来。由于Tempo的返回数据格式与Jaeger不同,需要进行数据格式转换。但在当前实现中,这种转换未能正确处理parentSpanId字段。
影响评估
虽然References信息缺失,但经过评估这并不影响Kiali的核心功能。References数组在这些API调用中实际上并未被使用,因此从功能角度来看是完整的。技术团队考虑过获取完整追踪数据的方案,但考虑到性能开销(需要为每个查询结果发起多次调用),这种方案被判定为不切实际。
解决方案
技术团队提出了两种可能的解决方案:
-
移除对References数组的检查:由于这些信息在相关API调用中并未实际使用,可以直接移除相关检查逻辑。
-
针对Tempo做特殊处理:在代码中区分Tempo和Jaeger的情况,仅对Tempo返回的数据跳过References检查。
经过权衡,技术团队倾向于第一种方案,因为References信息在这些API调用中并非必需,且保持代码简洁性更为重要。
后续处理
该问题已被标记为需要回迁至Kiali 2.4版本,相关修复已经完成并合并。这确保了使用Tempo作为追踪系统的用户能够获得与其他追踪系统一致的使用体验。
技术启示
这个案例展示了不同分布式追踪系统实现细节上的差异,以及在集成多个追踪系统时可能遇到的兼容性问题。对于开发者而言,在设计系统集成时需要考虑不同实现的技术细节,同时也要评估功能需求与实际使用场景,避免过度设计。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0193- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
awesome-zig一个关于 Zig 优秀库及资源的协作列表。Makefile00