OpenSearch项目中的读写分离架构设计与实现

2025-05-22 08:43:21作者：申梦珏Efrain

在分布式搜索系统中，读写分离是一种常见的架构优化手段。OpenSearch项目近期针对搜索副本分配机制进行了重要改进，本文将深入解析这一技术演进过程。

背景与问题

在OpenSearch的分布式架构中，传统的数据节点需要同时承担写入和查询两种负载。随着业务规模扩大，这种架构容易出现以下问题：

写入密集型操作（如索引构建）会占用大量资源，影响查询性能
查询请求波动可能导致资源争用
难以针对不同负载类型进行专项优化

技术演进历程

初始方案：基于过滤器的分配机制

最初团队采用了基于节点属性的动态过滤方案，通过cluster.routing.allocation.search.replica.dedicated.include设置来指定搜索节点。这种方案虽然灵活，但存在明显缺陷：

配置复杂：需要两步操作（定义节点属性+设置过滤器）
系统难以感知搜索节点拓扑，影响分片自动扩展等功能
缺乏明确的语义表达，运维难度大

中期改进：引入专用节点属性

针对上述问题，团队提出了更明确的节点标记方案：

node.attr.searchonly: "true"

这种方案通过预定义属性简化了配置，同时提供了清晰的语义。系统可以：

直接识别搜索专用节点
实现精确的副本分配控制
为后续的负载感知调度奠定基础

最终方案：角色分离设计

经过深入讨论，团队决定采用更彻底的架构改造：

将原有的"search"角色重命名为"warm"角色，专门用于可搜索快照
新建"search"角色，专用于搜索副本节点
确保角色互斥性，避免混合部署带来的复杂度

这种设计带来了以下优势：

角色定义清晰，与功能强关联
天然支持分区感知和自动扩展
为未来的热温冷架构演进预留空间

技术实现细节

在具体实现上，OpenSearch团队主要解决了几个关键问题：

版本兼容性：通过版本判断确保集群滚动升级时保持兼容
资源隔离：调整文件缓存配置，避免资源冲突
分配策略：完善SearchReplicaAllocationDecider决策逻辑
文档说明：明确新旧版本间的配置差异和迁移指南

最佳实践建议

对于计划采用读写分离架构的用户，建议：

生产环境应采用专用角色部署，而非属性标记
升级时确保管理节点先完成升级
合理规划搜索节点资源，特别是文件缓存配置
监控搜索节点的查询负载，及时调整副本数量

未来展望

这一架构改进为OpenSearch带来了更精细的资源管控能力。在此基础上，团队正在探索：

自动化的负载均衡策略
基于查询模式的智能路由
与热温冷架构的深度集成

读写分离架构的完善标志着OpenSearch向企业级搜索平台又迈出了重要一步，为用户提供了更灵活的性能调优手段。

OpenSearch

🔎 Open source distributed and RESTful search engine.

项目地址：https://gitcode.com/gh_mirrors/op/OpenSearch

登录后查看全文

项目优选

收起

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。