GreptimeDB v0.14.0 夜间版本发布：向量函数增强与分布式优化

2025-06-11 15:03:00作者：邬祺芯Juliet

GreptimeDB 是一款开源的分布式时序数据库，专注于处理大规模时序数据场景。它采用 Rust 语言开发，具有高性能、低延迟的特点，特别适合物联网、监控系统和金融分析等领域的应用。

核心功能更新

向量计算能力增强

本次版本引入了两个重要的向量计算函数，进一步提升了 GreptimeDB 在机器学习特征处理方面的能力：

vec_subvector 函数：允许用户从大向量中提取特定范围的子向量，这在特征工程中非常有用，可以方便地处理高维特征的分段分析。
vec_kth_elem 函数：能够快速获取向量中第k小的元素，为统计分析提供了更高效的操作方式，特别适用于需要频繁计算分位数的场景。

这些新增函数使得 GreptimeDB 能够更好地支持 AI/ML 工作负载，用户可以直接在数据库内完成更多预处理操作，减少数据移动带来的开销。

分布式架构优化

选举机制改进

MySQL 协议的选举逻辑得到了增强，提高了分布式环境下的可用性和一致性。这一改进使得 GreptimeDB 在分布式部署时能够更可靠地处理主节点选举和故障转移。

元数据管理优化

引入了 install_manifest_to 方法用于 Region 元数据管理，优化了元数据的安装和同步流程。同时实现了手动加载 manifest 的功能，为运维人员提供了更灵活的控制手段。

性能与稳定性提升

存储引擎改进

默认数据存储路径从临时目录(/tmp)调整为当前工作目录，这一变更避免了系统重启导致临时数据丢失的问题，提高了数据持久性。

查询处理优化

针对日志查询处理程序增加了新的方法，提升了日志分析的效率。同时修复了 MySQL 协议中布尔值预处理的问题，增强了协议兼容性。

监控与可观测性

新增了数据节点写入行数的 Grafana 监控指标，为运维人员提供了更直观的性能监控视图。同时改进了 OpenTelemetry 跟踪实现，优化了 trace 数据模型。

协议与接口调整

HTTP 接口现在默认禁用超时设置，更适合处理长时间运行的分析查询。Pipeline 相关接口的头部名称统一调整为 x-greptime-pipeline-name，提高了接口一致性。

总结

GreptimeDB v0.14.0 夜间版本在向量计算、分布式架构和查询性能等方面都有显著提升。新增的向量函数扩展了分析能力，元数据管理和选举机制的优化增强了分布式环境下的可靠性，而监控指标的完善则为生产环境运维提供了更好的支持。这些改进使得 GreptimeDB 在时序数据处理和分析场景中更具竞争力。

greptimedb

The open-source Observability 2.0 database. One engine for metrics, logs, and traces — replacing Prometheus, Loki & ES.

项目地址：https://gitcode.com/GitHub_Trending/gr/greptimedb

登录后查看全文