pgvectorscale 0.7.0 发布:支持过滤式近似最近邻搜索
pgvectorscale 是一个基于 PostgreSQL 的向量搜索扩展,它通过集成 DiskANN 算法提供了高效的近似最近邻(ANN)搜索能力。该项目由 Timescale 团队开发,旨在为 PostgreSQL 用户提供生产级的向量搜索解决方案。
过滤式 DiskANN 算法支持
本次 0.7.0 版本最重要的更新是引入了过滤式 DiskANN(Filtered DiskANN)算法支持。这一创新功能基于微软研究院发表的论文《Filtered DiskANN: Efficient Search in Large Scale Vector Databases with Boolean Constraints》。
过滤式 DiskANN 允许用户在向量搜索过程中加入布尔过滤条件,这在许多实际应用场景中非常有用。例如:
- 在电商推荐系统中,可以只搜索特定类别的商品
- 在内容检索中,可以限定只返回特定语言或特定发布日期的内容
- 在多租户系统中,可以确保用户只能看到自己有权限访问的数据
这种过滤能力是在索引层面实现的,而不是在查询后过滤,因此能够保持高效的搜索性能。算法会智能地跳过不符合过滤条件的向量,避免不必要的距离计算。
技术实现细节
为了实现过滤功能,项目团队对原有的 SbqNode 结构进行了抽象化改造,为支持带标签的变体做准备。这一底层改造使得索引能够存储和处理额外的元数据信息,为过滤条件提供支持。
在存储层面,0.7.0 版本还改进了页面槽位大小的计算方式,现在会考虑内存对齐因素,这有助于提升内存访问效率。
兼容性与构建改进
新版本继续保持对 PostgreSQL 13 到 17 版本的支持,并提供了针对 AMD64 和 ARM64 架构的预编译二进制包。构建系统方面,项目现在强制使用 LLVM 18 进行编译,确保了工具链的现代性和稳定性。
值得注意的是,项目已升级到 pgrx 0.12.9 框架,这是 Rust 语言编写 PostgreSQL 扩展的流行工具包。这一升级带来了更好的开发体验和运行时性能。
文档与使用说明
文档方面,0.7.0 版本澄清了几个重要内容:
- 明确了距离计算函数 distance_type_inner_product 现在是 CREATE OR REPLACE 语义
- 解释了近似最近邻搜索结果的排序可能不是严格精确的(relaxed ordering)
- 修正了从源代码安装的指导说明
对于开发者而言,新版本提供了更清晰的内部工作机制说明,特别是关于过滤条件如何与向量搜索协同工作的部分。
总结
pgvectorscale 0.7.0 通过引入过滤式 DiskANN 算法,显著扩展了向量搜索的应用场景,使开发者能够在保持高效搜索的同时加入业务逻辑约束。这一版本的技术改进和文档完善,使得该项目向生产就绪的目标又迈进了一步。对于需要在 PostgreSQL 中实现复杂向量搜索场景的团队来说,这个版本值得重点关注和评估。
- DDeepSeek-V3.1-BaseDeepSeek-V3.1 是一款支持思考模式与非思考模式的混合模型Python00
- QQwen-Image-Edit基于200亿参数Qwen-Image构建,Qwen-Image-Edit实现精准文本渲染与图像编辑,融合语义与外观控制能力Jinja00
GitCode-文心大模型-智源研究院AI应用开发大赛
GitCode&文心大模型&智源研究院强强联合,发起的AI应用开发大赛;总奖池8W,单人最高可得价值3W奖励。快来参加吧~044CommonUtilLibrary
快速开发工具类收集,史上最全的开发工具类,欢迎Follow、Fork、StarJava04GitCode百大开源项目
GitCode百大计划旨在表彰GitCode平台上积极推动项目社区化,拥有广泛影响力的G-Star项目,入选项目不仅代表了GitCode开源生态的蓬勃发展,也反映了当下开源行业的发展趋势。06GOT-OCR-2.0-hf
阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00openHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!C0300- WWan2.2-S2V-14B【Wan2.2 全新发布|更强画质,更快生成】新一代视频生成模型 Wan2.2,创新采用MoE架构,实现电影级美学与复杂运动控制,支持720P高清文本/图像生成视频,消费级显卡即可流畅运行,性能达业界领先水平Python00
- GGLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求Jinja00
Yi-Coder
Yi Coder 编程模型,小而强大的编程助手HTML013
热门内容推荐
最新内容推荐
项目优选









