GreptimeDB v0.13.0 版本发布：性能优化与功能增强

2025-06-11 17:38:02作者：尤峻淳Whitney

GreptimeDB 是一款开源的分布式时序数据库，专注于处理大规模时序数据场景。作为一款新兴的时序数据库产品，GreptimeDB 在性能、扩展性和功能丰富度方面持续迭代优化。最新发布的 v0.13.0 版本带来了一系列重要的性能优化和功能增强，特别是在稀疏数据处理、查询功能扩展和存储优化等方面有显著提升。

核心性能优化：Roaring Bitmap 引入

v0.13.0 版本最值得关注的改进之一是引入了 Roaring Bitmap 数据结构来优化稀疏值场景。在时序数据库应用中，经常会遇到大量稀疏数据的情况，即很多时间点上某些指标值为空或不存在。传统的存储方式在处理这类数据时效率较低，不仅占用存储空间大，查询性能也不理想。

Roaring Bitmap 是一种高效的压缩位图索引结构，特别适合处理稀疏数据。它通过将数据分块并采用不同的压缩策略，在保证查询性能的同时显著减少了内存和存储占用。这一改进使得 GreptimeDB 在处理大规模稀疏时序数据时，能够获得更好的存储效率和查询性能。

查询功能增强

IP 相关函数支持

新版本增加了对 IP 相关函数的支持，这使得 GreptimeDB 能够更好地处理网络运维、数据分析等场景中的数据。用户现在可以直接在 SQL 查询中使用专门的 IP 处理函数，而不需要先将数据导出到外部系统处理。

PromQL 功能扩展

对于使用 PromQL 查询语言的用户，v0.13.0 增加了对 quantile 和 count_values 函数的支持。quantile 函数用于计算分位数，是统计分析中的重要功能；count_values 则用于统计不同值的出现次数。这些功能的加入使得 GreptimeDB 作为 Prometheus 的长期存储方案更加完善。

窗口排序优化

修复了窗口排序在某些场景下不生效的问题，特别是当其他列别名与时间索引名称相同时的情况。这一改进确保了时间序列分析查询结果的准确性。

存储与分布式改进

S3 数据导出支持

v0.13.0 增加了将数据导出到 S3 存储的功能。这对于数据备份、迁移以及与其他系统的集成提供了便利。同时，还增加了对 S3 虚拟主机样式访问的支持，提高了与不同 S3 兼容存储服务的互操作性。

区域管理增强

在分布式管理方面，新版本改进了区域(region)的管理能力，包括：

支持通过 ALTER 语句修改区域 follower
在启动时检查区域 WAL 提供者以避免不一致
优化了区域 leader 状态验证逻辑

这些改进提高了分布式集群的稳定性和管理灵活性。

监控与可观测性

新版本在监控方面也有多项改进：

增加了对下载任务的监控指标
更新了 Grafana 仪表板，为每个面板添加了描述信息
优化了 OpenTelemetry 跟踪数据的建模方式

这些改进使得运维人员能够更全面地掌握系统运行状态，快速定位问题。

其他重要改进

新增了 vec_dim 函数，支持向量维度计算
实现了 topk 和 bottomk 函数，便于获取极值数据
优化了时间序列在扫描器中的分布，提高查询效率
改进了日志查询功能，支持复合过滤和别名表达式

总结

GreptimeDB v0.13.0 版本通过引入 Roaring Bitmap 等先进数据结构，显著提升了稀疏数据场景下的性能表现。同时，通过扩展查询功能特别是对 IP 处理和 PromQL 的支持，增强了在各种应用场景下的适用性。存储和分布式管理方面的改进则进一步提升了系统的稳定性和可管理性。这些变化使得 GreptimeDB 作为一个新兴的时序数据库解决方案，在功能和性能上都更加成熟和完善。

greptimedb

The open-source Observability 2.0 database. One engine for metrics, logs, and traces — replacing Prometheus, Loki & ES.

项目地址：https://gitcode.com/GitHub_Trending/gr/greptimedb

登录后查看全文