Kùzu 0.8.0发布：浏览器内图分析与全文搜索能力升级

2025-06-19 03:08:15作者：傅爽业Veleda

Kùzu是一个新兴的图数据库系统，专注于高性能的图数据存储和分析。作为现代数据架构中的重要组成部分，图数据库特别适合处理复杂的关系网络数据，如社交网络、推荐系统、知识图谱等场景。Kùzu以其简洁的设计和高效的执行引擎在开源图数据库领域崭露头角。

最新发布的Kùzu 0.8.0版本带来了两项重要创新：WASM支持和全文搜索功能。这些特性极大地扩展了Kùzu的应用场景和使用便利性。

浏览器内图分析：Kùzu-WASM

Kùzu 0.8.0最引人注目的特性是新增了对WebAssembly(WASM)的支持。这意味着开发者现在可以在浏览器环境中直接运行Kùzu图数据库，所有数据和计算都保持在浏览器会话内部，无需依赖后端服务器。

这项技术突破带来了几个显著优势：

完全客户端化：敏感数据无需离开用户设备，增强了隐私保护和数据安全性
离线能力：应用可以在没有网络连接的情况下继续运行图分析功能
即时响应：消除了网络延迟，提供更流畅的用户体验
简化部署：无需维护复杂的基础设施即可提供图数据库功能

Kùzu-WASM特别适合需要快速原型开发、数据可视化或隐私敏感的应用场景。教育领域也可以利用这一特性来创建交互式的图数据库教学工具。

全文搜索功能集成

0.8.0版本引入了fts扩展模块，为Kùzu增加了基于BM25算法的全文搜索能力。BM25是信息检索领域的经典算法，被广泛用于现代搜索引擎中，能够有效评估文档与查询的相关性。

Kùzu的全文搜索功能支持：

关键词搜索和短语查询
可配置的分析器参数
停用词过滤
相关性评分
组合查询（AND/OR逻辑）

这一功能使得Kùzu不仅能够处理结构化图查询，还能执行内容检索任务，大大扩展了应用场景。例如，可以构建一个既包含实体关系又能搜索内容的知识库系统。

关系表创建语法简化

Kùzu 0.8.0对关系表的创建语法进行了重要改进，将原先的CREATE REL TABLE GROUP语法统一为更简洁灵活的CREATE REL TABLE语法。这一变更使得：

语法更加直观：减少了学习曲线，新用户更容易上手
维护成本降低：简化了代码库中的语法处理逻辑
向后兼容：旧脚本仍可正常运行，保证平滑升级

关系表是图数据库中的核心概念，表示实体之间的连接。语法简化后，开发者可以更高效地定义数据模型。

性能优化：并行哈希聚合

在查询执行引擎方面，0.8.0版本引入了并行哈希聚合机制，显著提升了聚合查询的性能。这一优化特别有利于：

大规模数据统计
分组计算
复杂分析查询

哈希聚合是数据库系统中常见的优化技术，通过哈希表来高效组织中间结果。Kùzu的并行实现充分利用了现代多核CPU的计算能力，使得聚合操作可以线性扩展。

技术影响与应用前景

Kùzu 0.8.0的这些改进展示了项目团队对现代数据应用需求的深刻理解。WASM支持使图数据库走向更广泛的前端应用场景，全文搜索功能则填补了图数据库在内容检索方面的空白。

对于开发者而言，这些新特性意味着：

可以构建更丰富的数据应用，结合图关系分析和内容搜索
能够在浏览器环境中实现完整的数据处理流程
享受更简洁的API和更高效的查询执行

随着图数据库在各种领域的应用日益广泛，Kùzu通过0.8.0版本的创新，进一步巩固了其作为现代数据基础设施重要组件的地位。特别是WASM支持，为构建新一代去中心化、隐私保护的Web应用提供了强大工具。

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

458

446

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

255