Spring AI项目中SimpleLoggerAdvisor重复订阅导致聊天中断问题分析

2025-06-11 13:24:13作者：明树来

问题现象描述

在Spring AI项目中使用SimpleLoggerAdvisor时，开发者发现了一个异常现象：每次聊天会话期间，向模型发送的请求数量会异常递增。具体表现为：

第一次聊天发送1个请求
第二次聊天发送2个请求
第三次聊天发送3个请求
依此类推

这种递增现象最终会导致模型因超出请求限制而中断服务。从日志截图可以看到，请求消息被重复记录，且每次聊天的请求数量确实在不断增加。

问题根源分析

通过查看提供的LoggingAdvisor实现代码，可以发现问题出在流式处理(StreamAroundAdvisor)的实现方式上。核心原因在于：

重复订阅问题：在aroundStream方法中，每次流式请求都会创建一个新的MessageAggregator实例，但没有正确处理Flux的订阅机制。
副作用操作：before方法中对请求消息的日志记录操作被包含在Flux处理链中，导致每次订阅都会重复执行日志记录。
响应观察机制：observeAfter方法作为回调传递给MessageAggregator，可能在多个环节被触发。

技术原理深入

Spring AI中的Advisor机制借鉴了Spring AOP的设计思想，用于在AI模型调用前后插入横切逻辑。在流式处理场景下，需要特别注意响应式编程的特性：

冷热发布者：Flux作为冷发布者，每次订阅都会重新触发整个处理链。
背压机制：流式处理需要考虑背压控制，避免资源消耗过大。
副作用隔离：日志记录等副作用操作应该与核心处理逻辑分离。

解决方案建议

针对这个问题，可以采取以下几种解决方案：

方案一：重构LoggingAdvisor实现

@Override
public Flux<AdvisedResponse> aroundStream(AdvisedRequest advisedRequest, StreamAroundAdvisorChain chain) {
    // 将日志记录移出处理链
    advisedRequest.messages().forEach(message -> {
        logger.info("request: {}", message);
    });
    
    return chain.nextAroundStream(advisedRequest)
            .doOnNext(this::observeAfter);
}

方案二：使用共享的MessageAggregator

private final MessageAggregator messageAggregator = new MessageAggregator();

@Override
public Flux<AdvisedResponse> aroundStream(AdvisedRequest advisedRequest, StreamAroundAdvisorChain chain) {
    advisedRequest = before(advisedRequest);
    return messageAggregator.aggregateAdvisedResponse(
        chain.nextAroundStream(advisedRequest),
        this::observeAfter
    );
}

方案三：添加订阅控制

private final AtomicBoolean subscribed = new AtomicBoolean(false);

@Override
public Flux<AdvisedResponse> aroundStream(AdvisedRequest advisedRequest, StreamAroundAdvisorChain chain) {
    if (subscribed.compareAndSet(false, true)) {
        advisedRequest = before(advisedRequest);
        return chain.nextAroundStream(advisedRequest)
                .doOnNext(this::observeAfter)
                .doFinally(signal -> subscribed.set(false));
    }
    return chain.nextAroundStream(advisedRequest);
}