GlareDB v25.5.4 版本发布：性能优化与新功能解析

2025-07-10 21:47:39作者：瞿蔚英Wynne

GlareDB 是一个开源的分布式数据库系统，专注于提供高性能的数据处理能力。最新发布的 v25.5.4 版本带来了一系列重要的性能优化和新功能，特别是在查询执行和存储访问方面有显著改进。

查询执行性能优化

本次版本最核心的改进之一是查询执行引擎的性能优化。开发团队重点优化了哈希表在连接操作中的应用，通过三个连续的PR实现了这一改进：

这一系列优化显著提升了连接操作的执行效率，特别是对于大型数据集的连接查询，性能提升尤为明显。哈希表的使用减少了数据扫描和比较的次数，使得查询执行更加高效。

v25.5.4 版本新增了 approx_count_distinct 聚合函数。这个函数提供了近似计算不同值数量的能力，相比精确的 COUNT(DISTINCT) 操作，它在处理大数据集时能够显著降低计算资源消耗，同时保持可接受的精度误差。

开发团队修复了相关子查询（特别是连接操作中的子查询）的语义问题，确保它们具有正确的集合语义。这一修正保证了查询结果的准确性，特别是在复杂查询场景下，结果将更加符合SQL标准预期。

在存储访问方面，新版本增加了对Google Cloud Storage(GCS)的只读、无认证访问支持。这一改进使得用户可以更方便地访问公开的GCS数据，简化了数据集成流程。需要注意的是，这一功能仅支持公开可读的数据，不涉及任何认证机制。

作为常规维护的一部分，本次发布包含了安全相关的依赖更新，特别是升级了ring加密库的版本，从0.17.8提升到0.17.14，修复了已知的安全问题。

GlareDB v25.5.4 版本通过查询执行引擎的哈希表优化显著提升了连接操作的性能，新增的近似计数函数为大数据分析提供了更高效的解决方案，同时修正了子查询语义并扩展了存储访问能力。这些改进使得GlareDB在性能、功能和稳定性方面都有了进一步提升，为用户提供了更优质的数据处理体验。

登录后查看全文