首页
/ Apache SkyWalking 优化 ElasticSearch 性能:禁用 Doc Values 的实践指南

Apache SkyWalking 优化 ElasticSearch 性能:禁用 Doc Values 的实践指南

2025-05-08 09:33:17作者:廉皓灿Ida

背景与问题分析

Apache SkyWalking 作为一款优秀的应用性能监控系统,其存储后端通常采用 ElasticSearch 或 OpenSearch。随着监控数据量的增长,存储性能和查询效率成为系统优化的关键点。在最新讨论中,社区发现通过合理配置 ElasticSearch 的 doc values 属性可以显著提升系统性能。

Doc values 是 ElasticSearch 中一种列式存储结构,默认情况下所有字段都会启用。它主要用于排序、聚合和脚本计算等场景,通过将倒排索引中的数据预先存储在磁盘上,以优化这些操作的性能。然而,对于不需要这些操作的字段,doc values 不仅会占用额外的存储空间,还会增加索引写入时的开销。

技术方案设计

SkyWalking 社区提出了通过 @ElasticSearch.DisableDocValues 注解来标记不需要 doc values 的字段。这一设计既保持了向后兼容性,又能让新创建的索引获得性能优化。

适合禁用 doc values 的典型场景包括:

  1. 指标数据中的值字段:这些字段通常只用于展示而不需要排序或聚合
  2. 日志和追踪的条件字段:除延迟和时间戳外的其他条件字段,因为这些字段通常只用于精确匹配
  3. 元数据中的可搜索字段:如各种流量数据(*_traffic)中的搜索字段

实现细节与考量

在实际实现中,需要注意以下几点:

  1. 兼容性处理:方案需要确保新创建的索引应用优化,同时不影响已有索引的正常使用
  2. 性能监控:实施后需要密切监控查询性能和资源使用情况,确保达到预期效果
  3. 字段选择策略:不是所有字段都适合禁用 doc values,需要仔细评估每个字段的使用场景

预期收益

通过合理禁用 doc values,SkyWalking 可以获得以下收益:

  1. 存储空间节省:减少磁盘空间占用,特别是在大规模部署场景下
  2. 索引性能提升:降低写入时的CPU和IO开销,提高数据摄入速度
  3. 查询效率优化:对于简单匹配查询,减少不必要的磁盘读取操作

最佳实践建议

对于希望应用此优化的用户,建议:

  1. 在测试环境中先行验证,确认对现有查询无影响
  2. 重点关注高频查询的性能变化
  3. 定期审查字段使用情况,随着业务变化调整配置

这项优化体现了 SkyWalking 社区持续追求性能卓越的精神,通过精细化的存储配置,为用户提供更高效稳定的监控体验。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
docsdocs
暂无描述
Dockerfile
702
4.51 K
pytorchpytorch
Ascend Extension for PyTorch
Python
566
693
atomcodeatomcode
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started
Rust
546
98
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
957
955
kernelkernel
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
411
338
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.6 K
940
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.08 K
566
AscendNPU-IRAscendNPU-IR
AscendNPU-IR是基于MLIR(Multi-Level Intermediate Representation)构建的,面向昇腾亲和算子编译时使用的中间表示,提供昇腾完备表达能力,通过编译优化提升昇腾AI处理器计算效率,支持通过生态框架使能昇腾AI处理器与深度调优
C++
128
210
flutter_flutterflutter_flutter
暂无简介
Dart
948
235
Oohos_react_native
React Native鸿蒙化仓库
C++
340
387