OpenSearch HTTP REST API 在 zstd 压缩编码下的挂起问题分析

2025-05-22 21:05:31作者：温艾琴Wonderful

🔎 Open source distributed and RESTful search engine.

项目地址：https://gitcode.com/gh_mirrors/op/OpenSearch

问题现象

近期在 OpenSearch 2.19.0 版本中发现了一个与 HTTP 压缩传输相关的重要问题：当客户端请求头中包含 zstd 压缩编码选项时，服务端响应会出现挂起现象。具体表现为：

客户端发送带有 Accept-Encoding: deflate, gzip, br, zstd 头部的 HTTP 请求
服务端返回 200 OK 响应，并指定 content-encoding: zstd
但实际响应数据永远不会完成传输，导致连接挂起
该问题在 2.18.0 版本中不存在，属于新引入的回归问题

技术背景

OpenSearch 作为 Elasticsearch 的分支，继承了其网络通信架构，底层使用 Netty 处理 HTTP 请求。在 HTTP 压缩方面：

传统支持 gzip 和 deflate 压缩算法
Brotli(br) 是较新的压缩算法，具有更好的压缩率
Zstandard(zstd) 是 Facebook 开发的高效压缩算法，平衡了压缩率和速度

问题根源分析

经过深入调查，发现问题源于以下几个技术因素：

Netty 版本升级影响：OpenSearch 2.19.0 升级了内嵌的 Netty 版本，其中包含了对 zstd 压缩的相关修改。虽然 OpenSearch 本身并未明确支持 zstd HTTP 压缩，但由于依赖库的变化，触发了这一行为。
类路径冲突：OpenSearch 包含了 zstd-jni 库在类路径中，这使得 Netty 能够检测到 zstd 编解码器的可用性，从而尝试使用 zstd 压缩响应。
不完整的实现：虽然服务端识别并声明使用 zstd 压缩，但实际的压缩数据流处理可能存在缺陷，导致数据无法正确传输。

影响范围

该问题影响所有使用以下配置的环境：

OpenSearch 2.19.0 及以上版本
客户端请求中包含 zstd 压缩选项
未显式禁用 HTTP 压缩功能

临时解决方案

目前可采用的临时解决方案包括：

客户端调整：在客户端请求中移除 zstd 压缩选项，仅保留 Accept-Encoding: deflate, gzip, br
服务端配置：在 opensearch.yml 中显式禁用 HTTP 压缩：
```
http.compression: false
```
版本回退：暂时回退到 2.18.0 版本，等待官方修复

长期解决方案建议

从架构角度看，OpenSearch 项目组应考虑：

明确压缩支持策略：在文档中清晰说明支持的压缩算法列表
完整测试覆盖：对所有声明的压缩算法进行端到端测试
依赖管理：审慎评估网络库升级对核心功能的影响

总结

这个案例展示了开源项目中依赖管理的重要性，以及看似无害的库升级可能带来的意外副作用。对于生产环境用户，建议密切关注官方更新，并在升级前充分测试关键功能。目前可通过调整客户端或服务端配置规避此问题，期待官方在后续版本中提供完整修复。

🔎 Open source distributed and RESTful search engine.

项目地址：https://gitcode.com/gh_mirrors/op/OpenSearch

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

deepin linux kernel

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook