Spring Framework中WebClient与ObservationRegistry的兼容性问题分析
问题背景
在Spring Framework的最新版本中,开发人员发现了一个关于WebClient与ObservationRegistry结合使用时的问题。具体表现为当WebClient配置了ObservationRegistry并启用重试机制(retry)时,系统会抛出InvalidObservationException异常,提示"Observation 'http.client.requests' has already been started"。
技术细节
这个问题源于Micrometer 1.14.0版本引入的ObservationValidator机制。ObservationValidator是一个用于验证观测(Observation)生命周期的工具,它会严格检查每个观测的开始(start)和结束(stop)操作是否成对出现且顺序正确。
在WebClient的重试场景中,每次重试都会尝试启动一个新的观测,但之前的观测可能尚未正确结束。这种重叠的观测生命周期违反了ObservationValidator的验证规则,导致系统抛出异常。
影响范围
该问题主要影响以下组合使用场景:
- 使用Spring Framework的WebClient进行HTTP调用
- 配置了ObservationRegistry(特别是TestObservationRegistry)
- 启用了重试机制(retry)
在Spring Boot 3.3.10及以下版本中,这个问题不会出现,但在Spring Boot 3.4.4及以上版本中会触发异常。
解决方案
Spring团队已经确认并修复了这个问题,修复将包含在下一个6.2.x维护版本中。对于当前遇到此问题的开发者,可以考虑以下临时解决方案:
- 暂时降级到Spring Boot 3.3.10版本
- 在重试场景中暂时不使用ObservationRegistry
- 等待即将发布的修复版本
最佳实践
为了避免类似问题,开发者在结合使用观测功能和重试机制时应注意:
- 确保每次观测都有明确的开始和结束
- 在重试逻辑中正确处理观测生命周期
- 在测试环境中使用TestObservationRegistry时,注意其严格的验证规则
总结
这个问题展示了在分布式系统观测中处理复杂场景(如重试)时的挑战。Spring团队通过引入更严格的验证机制提高了系统的可靠性,同时也带来了新的兼容性考虑。开发者应当关注这类底层机制的变化,以便更好地利用框架提供的观测能力。
随着微服务架构和可观测性需求的增长,这类问题的及时解决对于保证系统稳定性至关重要。Spring团队对此问题的快速响应也体现了其对开发者体验的重视。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0216
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03