Databend 1.2.706 夜间版发布:自动清理与 Iceberg 集成增强
Databend 是一款开源的云原生数据仓库,以其高性能和弹性扩展能力著称。它采用 Rust 语言编写,支持标准的 SQL 语法,并提供了与多种数据格式和存储系统的无缝集成能力。最新发布的 1.2.706 夜间版带来了一系列值得关注的功能增强和优化。
核心功能更新
自动清理机制优化
本次版本引入了 fuse_vacuum2() 表函数和自动清理功能,显著提升了存储空间管理能力。自动清理机制能够智能识别并回收不再使用的数据文件,有效降低存储成本。这一功能特别适合频繁进行数据更新的场景,解决了传统数据仓库中常见的"存储膨胀"问题。
Iceberg 数据湖集成增强
对 Apache Iceberg 格式的支持得到了进一步扩展,新增了数据库 DML 操作能力。这意味着用户现在可以直接通过 Databend 对 Iceberg 格式的数据执行更丰富的操作,简化了数据湖架构下的数据管理流程。同时,针对 Iceberg 目录的 SHOW TABLES 命令也进行了性能优化。
UNPIVOT 功能增强
UNPIVOT 操作现在支持 AS 语法,为行列转换提供了更灵活的列命名方式。这一改进使得数据透视操作更加符合用户的使用习惯,特别是在处理复杂的数据转换场景时,能够提供更直观的操作体验。
性能优化与稳定性提升
查询优化器改进
查询优化器新增了对布隆索引的支持,能够智能识别并利用简单类型转换后的表达式进行剪枝优化。这一改进显著提升了包含类型转换条件的查询性能。同时,针对 TPCDS 标准测试集的优化器单元测试被加入,确保了优化器在各种场景下的稳定性。
存储层优化
存储引擎进行了多项底层优化:
- 改进了稀疏数据读取效率
- 修正了 Hilbert 空间聚类信息的处理逻辑
- 增加了块文件大小的统计信息
- 优化了 Parquet 元数据缓存机制,不再依赖文件修改时间作为缓存键
架构改进
状态机逻辑重构
元数据管理模块进行了重要重构,将共享状态机逻辑提取到独立的外部 crate 中。这一架构改进使得代码结构更加清晰,降低了模块间的耦合度,为未来的功能扩展奠定了更好的基础。
虚拟数据模式抽象
新增了 VirtualDataSchema 到 TableMeta 的抽象,这一改进优化了表元数据的管理方式,为复杂查询场景下的元数据处理提供了更灵活的支持。
总结
Databend 1.2.706 夜间版在存储管理、查询优化和系统架构等多个方面都有显著提升。自动清理功能的引入使存储管理更加智能化,而对 Iceberg 集成的增强则进一步扩展了 Databend 在数据湖场景下的应用能力。这些改进共同推动 Databend 向更成熟的企业级数据仓库解决方案迈进。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust099- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00