RavenDB 7.0.0发布：向量搜索与增强ETL功能解析

2025-06-14 10:40:59作者：平淮齐Percy

RavenDB是一个开源的NoSQL文档数据库，以其高性能、低延迟和易用性著称。它支持ACID事务、分布式架构和多种数据模型，广泛应用于需要处理大量非结构化数据的场景。最新发布的7.0.0版本带来了多项重要更新，特别是在AI集成和数据集成方面有了显著增强。

向量搜索功能

RavenDB 7.0.0最引人注目的新特性是向量搜索支持。这一功能使RavenDB能够作为向量数据库使用，为AI和机器学习应用提供了强大的支持。向量搜索允许用户存储和查询高维向量数据，这对于相似性搜索、推荐系统和自然语言处理等应用至关重要。

实现原理上，RavenDB通过专门的索引结构优化了向量相似度计算，支持常见的距离度量如余弦相似度和欧几里得距离。开发人员现在可以直接在RavenDB中存储嵌入向量，并执行高效的最近邻搜索，而无需依赖外部向量数据库。

增强的ETL功能

7.0.0版本在ETL(提取、转换、加载)功能方面有两个重要扩展：

首先是新增了对Amazon SQS(简单队列服务)的支持。这使得RavenDB能够与SQS队列进行双向数据交互，为构建基于消息的分布式系统提供了更灵活的选择。开发人员可以配置RavenDB将文档变更作为消息推送到SQS队列，或者从SQS队列消费消息并写入数据库。

另一个重要新增是对Snowflake数据仓库的支持。Snowflake作为云原生数据仓库的领导者，与RavenDB的集成使得用户能够轻松地将操作数据同步到分析环境中。这一ETL连接器支持全量和增量同步，并提供了丰富的数据转换选项。

日志系统革新

RavenDB 7.0.0完全重构了其日志系统，采用了NLog作为基础框架。新日志系统提供了更细粒度的控制、更好的性能和更丰富的输出选项。管理员现在可以更灵活地配置日志级别、过滤条件和输出目标。

特别值得一提的是，新日志系统与Grafana Loki等现代日志聚合工具有着良好的集成能力，使得大规模部署中的日志收集和分析变得更加简单高效。

其他重要改进

在客户端API方面，7.0.0版本默认启用了批量插入操作的压缩功能，并改用zstd作为默认的HTTP压缩算法，这显著减少了网络传输的数据量，提高了性能。

管理界面(Studio)也进行了多项改进，包括重新设计的Admin Logs视图、反馈表单和全新的文档修订(Revisions)管理界面，使得日常运维工作更加直观便捷。

升级注意事项

从旧版本升级到7.0.0时，用户需要注意几个关键点：JavaScript引擎已更新至Jint 4.1.0版本，可能影响现有的JavaScript代码；同时，日志系统的完全重构意味着现有的日志配置需要进行相应调整。

总的来说，RavenDB 7.0.0通过引入向量搜索和增强ETL功能，进一步扩展了其作为现代数据平台的能力边界，为AI集成和企业数据集成提供了更强大的支持。

ravendb

ACID Document Database

项目地址：https://gitcode.com/gh_mirrors/ra/ravendb

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

496

521

pytorch

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

665

308