Databend v1.2.688-nightly版本发布：优化集群管理与查询性能

2025-06-08 15:35:51作者：侯霆垣

Databend是一个开源的云原生数据仓库，专注于提供高性能的弹性计算能力。它采用现代架构设计，支持实时分析和大规模数据处理。本次发布的v1.2.688-nightly版本带来了一系列重要的功能改进和性能优化。

核心功能增强

希尔伯特空间聚类算法

新版本引入了基于希尔伯特空间填充曲线的聚类算法。这种算法能够更高效地组织数据存储，特别适合处理大规模空间数据。希尔伯特曲线具有良好的局部性保持特性，可以显著提升范围查询的性能。

聚合索引的VACUUM支持

开发团队为聚合索引增加了VACUUM操作支持。这一改进使得系统能够更有效地清理和优化索引结构，特别是在频繁更新和删除的场景下。当索引被删除后通过CREATE OR REPLACE重建时，VACUUM操作也能正确识别并处理这些变更。

仓库级别的查询管理

新版本增强了集群管理能力，支持在仓库(warehouse)级别查看执行中的查询列表(show processlist)和终止查询(kill query)。这一功能为多租户环境下的资源隔离和查询管理提供了更细粒度的控制手段。

性能优化与稳定性改进

流式上传优化

文件上传到存储阶段(stage)的过程进行了重构，现在采用流式处理方式替代原有实现。这一变更显著降低了内存占用，特别是在处理大文件时效果更为明显。

哈希表散射优化

查询执行引擎中的哈希表散射操作进行了改进，现在会始终发送聚合元数据。这一调整解决了在某些场景下可能导致的数据不一致问题，提高了分布式查询的可靠性。

心跳机制增强

针对网络故障场景，改进了集群节点间的心跳检测机制。新实现能够更好地处理临时网络中断，确保集群状态的一致性。

查询引擎修复

修复了array_agg函数处理NULL参数时的问题，确保函数在各种输入条件下都能正确工作。同时修正了常量表扫描中惰性列(lazy columns)缺失的问题，完善了查询优化器的功能。

权限与安全改进

全局设置(global settings)的权限检查逻辑进行了重构。现在只有修改全局设置时才需要超级用户权限，这一变更既提高了安全性，又减少了不必要的权限检查开销。

测试与质量保障

测试套件进行了多项改进，包括修复字典测试的不稳定性问题，优化容器管理逻辑以避免冲突。这些变更提升了持续集成环境的可靠性。

Databend v1.2.688-nightly版本通过上述多项改进，进一步提升了系统的稳定性、查询性能和集群管理能力。开发团队持续关注用户反馈，不断优化产品体验，为构建高效可靠的数据分析平台提供支持。

databend

项目地址：https://gitcode.com/GitHub_Trending/da/databend

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

358

217

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

Databend v1.2.688-nightly版本发布：优化集群管理与查询性能

核心功能增强

希尔伯特空间聚类算法

聚合索引的VACUUM支持

仓库级别的查询管理

性能优化与稳定性改进

流式上传优化

哈希表散射优化

心跳机制增强

查询引擎修复

权限与安全改进

测试与质量保障

相关内容推荐

最新内容推荐

项目优选