Spring Kafka中KafkaTemplate的Span标签问题解析

2025-07-03 21:52:03作者：咎竹峻Karen

在Spring Kafka 3.1.4版本中，开发人员发现了一个与分布式追踪相关的重要问题：当使用KafkaTemplate发送消息时，如果在发送过程中尝试向当前Span添加标签，这些标签会被错误地添加到HTTP请求的Span中，而不是预期的Kafka发送Span。

问题背景

在微服务架构中，分布式追踪是理解系统行为的关键工具。Spring Kafka通过Micrometer集成了分布式追踪功能，允许开发人员监控Kafka消息的发送过程。然而，在KafkaTemplate的实现中，存在一个关于Span作用域管理的缺陷。

问题本质

问题的核心在于KafkaTemplate.observeSend()方法的实现方式。该方法创建并启动了一个Observation（观察）对象，但没有正确地打开其作用域(Scope)。根据Micrometer 1.10.0+版本的Observation API规范，手动管理Observation时，必须同时调用start()和openScope()方法，并在try-with-resources块中确保作用域的正确关闭。

技术细节分析

在当前的实现中，KafkaTemplate.observeSend()方法存在以下问题：

创建并启动了Observation对象
直接调用doSend()方法发送消息
在发送过程中，任何对当前Span的标签操作都会作用于错误的Span

这是因为没有打开Observation的作用域，导致Tracer无法正确识别当前活动的Span。根据Micrometer的线程绑定机制，Span上下文是通过ThreadLocal维护的，而正确的作用域管理是确保这一机制正常工作的关键。

影响范围

这个问题会影响所有满足以下条件的应用：

使用Spring Kafka 3.1.4或相近版本
启用了Micrometer的分布式追踪功能
在Kafka消息发送过程中需要添加自定义Span标签
依赖这些标签进行监控或调试

解决方案

官方修复方案是在observeSend()方法中添加正确的作用域管理。修复后的代码结构应该如下：

Observation observation = ...;
observation.start();
try (Scope scope = observation.openScope()) {
    return doSend(producerRecord, observation);
} catch (RuntimeException ex) {
    // 异常处理
}

对于无法立即升级的用户，可以采取以下临时解决方案：

继承KafkaTemplate类
重写doSend()方法
在方法中手动管理Observation作用域

@Override
protected CompletableFuture<SendResult<K, V>> doSend(
        final ProducerRecord<K, V> producerRecord,
        Observation observation) {
    try (var scope = observation.openScope()) {
        return super.doSend(producerRecord, observation);
    }
}