Databend v1.2.687-nightly版本发布：增强查询功能与稳定性优化

2025-06-08 21:18:10作者：牧宁李

项目简介

Databend是一个开源的云原生数据仓库，采用Rust语言开发，具有高性能、弹性扩展和低成本等特点。它支持标准SQL语法，能够处理PB级别的数据分析工作负载，同时兼容多种数据格式和存储后端。

版本亮点

查询功能增强

本次nightly版本在查询功能方面有几个重要改进。首先，新增了对NDJSON格式文件中不同时间单位时间戳的支持，这使得处理包含各种时间格式的NDJSON文件变得更加灵活。开发团队特别优化了时间戳解析逻辑，确保不同精度的时间戳都能被正确识别和处理。

其次，SQLSmith模糊测试工具现在支持生成sqllogic测试用例，这将显著提升SQL查询引擎的测试覆盖率。通过模拟各种特殊条件和异常输入，开发团队能够更全面地验证查询引擎的稳定性和正确性。

稳定性修复

在稳定性方面，本次版本修复了多个关键问题。其中最重要的是解决了聚合索引与min/max重写优化之间的冲突问题。这个修复确保了在使用聚合索引时，查询优化器能够正确应用min/max重写优化，避免潜在的性能下降。

另一个重要修复是针对带引号标识符在大小写敏感模式下的名称解析问题。在某些特定场景下，系统可能会错误解析带引号的标识符，导致查询失败或返回错误结果。此修复确保了标识符解析在各种情况下的准确性。

性能监控改进

为了更好监控查询性能，开发团队改进了聚合操作的状态行数记录机制。现在系统会准确记录聚合操作处理的行数，这为性能分析和优化提供了更精确的数据支持。同时，在Parquet文件写入过程中，系统现在会保留创建者信息，便于后续的元数据追踪和分析。

技术细节

时间处理优化

在时间处理方面，开发团队特别加强了对时间间隔微秒总数的检查。当处理极大或极小的时间间隔时，系统现在会进行严格的数值范围检查，避免潜在的计算问题。这一改进显著提升了时间相关计算的可靠性。

集群管理改进

针对集群管理，修复了仓库审计日志在添加集群时可能失效的问题。现在无论集群规模如何变化，审计日志都能正确记录所有相关操作，为系统管理员提供了完整的操作追踪能力。

函数处理优化

在函数处理方面，修复了可空标量值在函数注册时可能出现的问题。这一改进确保了系统能够正确处理包含NULL值的函数参数，提高了查询引擎的健壮性。

总结

Databend v1.2.687-nightly版本虽然在功能上没有重大新增，但在查询稳定性、性能监控和错误处理方面做出了多项重要改进。这些优化使得系统在处理复杂查询和大规模数据时更加可靠，为后续的功能扩展奠定了坚实基础。开发团队持续关注用户体验和系统稳定性，通过不断优化核心组件来提升整体性能。

databend

项目地址：https://gitcode.com/GitHub_Trending/da/databend

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理