首页
/ Quickwit 项目中的 Ingest V2 服务优雅关闭问题分析

Quickwit 项目中的 Ingest V2 服务优雅关闭问题分析

2025-05-24 15:56:44作者:伍希望

问题背景

在 Quickwit 分布式搜索项目中,Ingest V2 服务作为数据摄入的关键组件,其优雅关闭机制存在一些潜在问题。当用户尝试正常退出 Quickwit 服务时,偶尔会遇到 Ingest V2 服务在"decommissioning"阶段挂起的情况,只能通过强制终止(kill -9)来结束进程。

问题现象

从日志中可以观察到,当发送终止信号(CTRL+C)时,服务会打印"decommissioning ingester"信息,但随后便停止响应,无法正常退出。这种情况并非每次都能复现,具有一定的随机性。

根本原因分析

经过技术团队深入调查,发现该问题由多个因素共同导致:

  1. 测试环境残留问题:即使在未显式启用 Ingest V2 的情况下(QW_ENABLE_INGEST_V2未设置),执行REST API测试仍会创建shard并写入少量记录。这些shard不会被索引,也不会被清理。当下次尝试关闭未启用V2的节点时,系统会等待这些shard被清空,而这一过程永远不会完成。

  2. 控制平面提前关闭问题:当控制平面(control plane)在新索引节点有机会调度其摄入管道之前就被关闭时,该节点在关闭过程中会永久挂起,因为其shard永远不会被索引。

  3. 集群同时关闭问题:当同时关闭集群中的所有节点时,索引器会尝试提交最后一个空批次(可能是为了通知shard已关闭),但由于元数据存储(metastore)和控制平面已不可用,这一操作会无限期失败。

解决方案与改进

技术团队通过添加集成测试来验证这些问题:

  1. 添加了ingest_tests::test_shutdown_metastore_first测试用例,专门验证控制平面提前关闭场景
  2. 添加了集群同时关闭场景的测试用例

这些测试在Ingest V1模式下通过,但在启用Ingest V2时失败,证实了问题的存在。

技术细节补充

在分布式系统中,服务的优雅关闭是一个复杂的问题,需要考虑:

  • 数据一致性:确保所有在途数据被正确处理
  • 资源清理:正确释放所有占用的资源
  • 依赖管理:处理服务间的依赖关系,如控制平面与数据平面的交互
  • 超时机制:为各种操作设置合理的超时,避免无限等待

Quickwit团队正在针对这些问题进行修复,包括改进shard的生命周期管理、优化关闭序列以及增强错误处理机制。

总结

Quickwit项目中Ingest V2服务的优雅关闭问题揭示了分布式系统设计中常见的挑战。通过深入分析问题根源并添加针对性测试,团队正在稳步推进解决方案。这类问题的解决不仅提高了系统的可靠性,也为类似分布式系统的设计提供了宝贵经验。

登录后查看全文
热门项目推荐
相关项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
52
461
kernelkernel
deepin linux kernel
C
22
5
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
349
381
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
131
185
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
873
517
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
336
1.09 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
179
264
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
607
59
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4