Spring AI项目中Chat Memory流式处理的技术解析与最佳实践

2025-06-10 19:21:50作者：宣海椒Queenly

项目地址：https://gitcode.com/gh_mirrors/sp/spring-ai

流式处理中的常见误区

在Spring AI项目中使用Chat Memory功能时，开发者可能会遇到一个典型的技术问题：当启用流式处理模式(streaming mode)时，系统抛出"No StreamAdvisors available to execute"异常，而非流式模式却能正常运行。这种现象往往源于对响应式编程模型的理解不足。

问题本质分析

这个问题的核心在于响应式编程中Flux对象的订阅机制。在原始问题场景中，开发者对同一个Flux对象执行了两次订阅操作：

通过subscribe()方法注册消费者
随后又调用blockLast()方法

这种双重订阅会导致Spring AI内部的DefaultAroundAdvisorChain组件被重复执行。当PromptChatMemoryAdvisor和ChatModelStreamAdvisor完成正常的adviseStream处理后，DefaultAroundAdvisorChain的nextStream方法会被错误地再次调用，此时已经没有可用的StreamAdvisor，从而抛出异常。

技术解决方案

正确的处理方式应该是采用单一订阅模式，通过操作符链式处理响应流：

chatResponseFlux
    .doOnNext(chatResponse -> {
        // 处理每条响应
        AssistantMessage message = chatResponse.getResult().getOutput();
        System.out.print(message.getText());
    })
    .doOnError(error -> System.err.println("处理异常: " + error.getMessage()))
    .doOnComplete(() -> System.out.println("\n处理完成"))
    .blockLast();

最佳实践建议

单一订阅原则：对于任何响应式流，都应保持单一订阅，避免重复消费
操作符组合：利用doOnNext、doOnError等操作符构建处理管道
资源管理：在流结束时使用doOnComplete进行资源清理
异常处理：始终包含doOnError处理可能的异常情况

技术深度解析

Spring AI的流式处理架构基于Project Reactor实现，其核心是响应式编程范式。Chat Memory功能通过Advisor链模式实现，其中：

PromptChatMemoryAdvisor负责维护对话历史
ChatModelStreamAdvisor处理模型流式输出
DefaultAroundAdvisorChain管理advisor执行顺序

理解这一架构有助于开发者正确使用API，避免因不当操作导致的状态异常。

总结

通过本文的分析，开发者应该认识到响应式编程中订阅机制的重要性。在Spring AI项目中使用Chat Memory的流式功能时，遵循单一订阅原则和正确的操作符组合是保证功能正常的关键。这不仅解决了"No StreamAdvisors"异常问题，也为构建健壮的AI应用奠定了基础。

项目地址：https://gitcode.com/gh_mirrors/sp/spring-ai

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理