Kiali项目中Tempo集成时Span引用信息缺失问题分析

2025-06-24 05:08:02作者：明树来

问题背景

在Kiali与分布式追踪系统Tempo集成时，发现了一个关于Span引用信息的技术问题。当使用Tempo作为外部追踪系统时，从Kiali API获取的Span对象中缺少References信息，而同样的配置下如果使用Jaeger端口则能正常显示这些引用关系。

通过Kiali的API端点查询Span数据时，当配置使用Tempo原生端口3200并设置provider为tempo时，返回的Span对象中References数组为空。而当配置使用Jaeger端口16685时，相同的Span数据则包含完整的References信息。

经过技术团队深入调查，发现这个问题源于Tempo查询机制与Jaeger的差异。Tempo的查询接口在设计上无法返回parentSpanId字段，而这个字段正是构建References数组的关键数据。References数组在分布式追踪中用于表示Span之间的父子关系或跟随关系。

在Kiali内部实现中，References信息是通过parentSpanId转换而来。由于Tempo的返回数据格式与Jaeger不同，需要进行数据格式转换。但在当前实现中，这种转换未能正确处理parentSpanId字段。

虽然References信息缺失，但经过评估这并不影响Kiali的核心功能。References数组在这些API调用中实际上并未被使用，因此从功能角度来看是完整的。技术团队考虑过获取完整追踪数据的方案，但考虑到性能开销（需要为每个查询结果发起多次调用），这种方案被判定为不切实际。

技术团队提出了两种可能的解决方案：

经过权衡，技术团队倾向于第一种方案，因为References信息在这些API调用中并非必需，且保持代码简洁性更为重要。

该问题已被标记为需要回迁至Kiali 2.4版本，相关修复已经完成并合并。这确保了使用Tempo作为追踪系统的用户能够获得与其他追踪系统一致的使用体验。

这个案例展示了不同分布式追踪系统实现细节上的差异，以及在集成多个追踪系统时可能遇到的兼容性问题。对于开发者而言，在设计系统集成时需要考虑不同实现的技术细节，同时也要评估功能需求与实际使用场景，避免过度设计。

登录后查看全文