chDB项目v3.2.0版本发布：新增流式查询API与内存优化

2025-06-19 21:16:35作者：伍希望

chDB是一个基于ClickHouse的高性能嵌入式数据库引擎，它允许开发者在应用程序中直接嵌入ClickHouse的强大分析能力，而无需部署完整的ClickHouse服务。该项目通过提供简洁的API接口，使得开发者可以轻松地在Python等语言环境中执行SQL查询并获取分析结果。

版本亮点

1. 流式查询API的引入

v3.2.0版本最显著的改进是新增了流式查询功能。这一特性允许开发者以流式方式处理大型查询结果集，特别适合处理大数据量的场景。传统的一次性获取全部结果的方式在处理大数据集时可能会导致内存压力，而流式API则可以按需获取数据，显著降低内存占用。

流式API的工作原理是分批获取查询结果，开发者可以逐批处理数据，而不需要等待整个查询完成。这种方式不仅提高了内存使用效率，还能实现更快的首屏响应时间，因为应用程序可以在第一批数据到达时就开始处理。

2. 内存泄漏修复

该版本修复了一个潜在的内存泄漏问题，该问题源于查询结果内存未能被正确释放。内存泄漏是长期运行应用程序的常见痛点，特别是在需要频繁执行查询的场景下。通过修复这一问题，chDB现在能够更可靠地管理内存资源，确保长时间运行的稳定性。

3. 连接式API示例

v3.2.0还新增了基于连接的API使用示例。这种模式更接近传统数据库的使用方式，允许开发者建立持久连接并复用该连接执行多个查询。连接式API相比单次查询API在某些场景下可能提供更好的性能，特别是在需要执行多个相关查询时。

技术实现细节

在底层实现上，chDB v3.2.0继续基于ClickHouse的核心引擎，但通过精心设计的包装层提供了更简单易用的接口。流式API的实现利用了ClickHouse本身的分块处理能力，通过适当的缓冲和内存管理，在保持高性能的同时提供了更友好的编程接口。

内存管理的改进涉及到底层C++代码的调整，确保所有分配的内存都能在适当的时候被释放。这对于Python等托管环境尤为重要，因为这些环境的内存回收机制可能与原生代码不完全同步。

适用场景与优势

chDB特别适合以下场景：

需要嵌入式分析功能的应用程序
数据科学和机器学习工作流中的本地数据处理
资源受限环境下的数据分析任务
需要快速原型开发的场景

相比完整部署ClickHouse服务，chDB的优势在于：

零配置部署
更低的资源开销
更简单的集成方式
更快的启动时间

升级建议

对于现有用户，升级到v3.2.0可以获得更好的内存管理和新的流式处理能力。特别是那些处理大型数据集的应用程序，流式API可以显著改善内存使用情况。新用户可以直接使用v3.2.0开始开发，享受最新的特性和改进。

该版本提供了广泛的平台支持，包括macOS(Intel和ARM架构)以及Linux(x86_64和aarch64)系统，并支持Python 3.8到3.13的多个版本。用户可以根据自己的环境选择合适的预编译包进行安装。

总的来说，chDB v3.2.0通过引入流式查询和改善内存管理，进一步巩固了其作为嵌入式分析引擎的地位，为开发者提供了更强大、更可靠的工具来处理数据密集型任务。

chdb

chDB is an in-process OLAP SQL Engine 🚀 powered by ClickHouse

项目地址：https://gitcode.com/gh_mirrors/ch/chdb

登录后查看全文

项目优选

收起

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

MindQuantum is a general software library supporting the development of applications for quantum computation.

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.11 K

682