Havenask中disable_follower_build参数对全量表实时查询的影响分析

2025-07-09 06:38:02作者：裴麒琰

Havenask is a large-scale distributed information search system widely used within Alibaba Group

项目地址：https://gitcode.com/gh_mirrors/ha/havenask

参数背景

在Havenask分布式搜索引擎的离线表配置中，disable_follower_build是一个影响集群数据同步行为的重要参数。该参数默认配置在hape_conf/offline_table/clusters/default_cluster.json文件中，控制着follower节点是否参与数据构建过程。

参数作用机制

当disable_follower_build设置为true时，系统会表现出以下行为特征：

只有leader角色的searcher节点会消费实时数据
follower角色的searcher节点将不参与实时数据的消费
在查询请求被随机分发到不同节点时，可能导致部分查询无法获取最新数据

这种配置在全量表模式下会产生明显的数据不一致现象：用户查询时，如果请求被路由到leader节点，则可以获取最新写入的文档；若被路由到follower节点，则无法获取最新数据，造成"有时能查到，有时查不到"的不稳定现象。

适用场景分析

根据Havenask的设计原理，disable_follower_build参数主要适用于以下场景：

直写表模式：在直写表架构中，数据写入直接作用于leader节点，通过后续的同步机制传播到follower节点。此时临时禁用follower构建可以降低集群负载。
索引构建优化：在某些大规模索引构建场景下，临时禁用follower构建可以减少资源消耗，待leader构建完成后再统一同步。
维护模式：在集群维护或升级期间，可能需要暂时停止follower的数据构建过程。

全量表模式的最佳实践

对于全量表模式，建议将disable_follower_build设置为false，这是因为：

数据一致性要求：全量表通常对数据实时一致性要求较高，需要所有节点都能及时获取最新数据。
查询负载均衡：在全量表查询场景下，请求会被均匀分发到集群所有节点，必须确保每个节点数据一致。
实时性保证：禁用follower构建会导致实时数据无法及时同步，违背全量表的设计初衷。

配置建议

基于不同表模式的特性，推荐以下配置方案：

全量表模式：
```
"disable_follower_build": false
```
直写表模式：
```
"disable_follower_build": true
```

在实际生产环境中，配置此参数时需要综合考虑业务对数据实时性的要求、集群负载情况以及查询性能需求等因素，做出最适合业务场景的选择。

Havenask is a large-scale distributed information search system widely used within Alibaba Group

项目地址：https://gitcode.com/gh_mirrors/ha/havenask

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库