ParadeDB v0.15.0发布:PostgreSQL全文搜索的重大性能优化
2025-06-08 07:37:16作者:羿妍玫Ivan
ParadeDB是一个基于PostgreSQL的开源全文搜索引擎扩展,它通过集成Tantivy(Rust编写的高性能搜索引擎)为PostgreSQL提供了强大的全文搜索能力。最新发布的v0.15.0版本带来了一系列重要的性能优化和稳定性改进,特别是在并发处理和索引维护方面。
核心性能优化
本次版本最显著的改进集中在并发处理和索引维护机制上:
-
并行扫描优化:现在系统会将段ID列表正确传递给并行扫描工作线程,显著提高了大规模数据集的查询效率。
-
文档删除机制重构:
ambulkdelete()函数现在通过"文档地址"直接删除文档,而不是之前的间接方式,这使得批量删除操作的效率提升了数倍。 -
真空(VACUUM)操作改进:修复了VACUUM操作可能错误删除不该删除的段的问题,同时增加了对VACUUM操作的中断支持,使长时间运行的维护操作可以被安全取消。
并发控制与稳定性
针对高并发场景下的稳定性问题,v0.15.0做出了多项重要修复:
- 彻底解决了多个可能导致死锁的场景
- 优化了事务状态检查,绕过
pg_sys::IsTransactionState()直接链接到函数 - 改进了线程间的中断处理机制,确保在高负载下系统仍能保持稳定
查询功能增强
在搜索功能方面,新版本带来了以下改进:
- 日期时间查询现在支持亚秒级精度,满足更精确的时间范围查询需求
term_set操作现在支持JSON格式输入,提高了查询的灵活性- 移除了旧的
fuzzy_phrase查询,改用更高效的match查询替代
底层架构升级
ParadeDB v0.15.0还包含了多项底层架构的改进:
- 升级了Tantivy依赖版本,获得最新的搜索引擎优化
- 实现了新的
tantivy::Directory::supports_garbage_collection()函数,优化了索引垃圾回收机制 - 改进了
ctid字段的处理方式,提高了系统整体效率
系统兼容性
新版本继续保持对多种环境的广泛支持:
- 支持PostgreSQL 14至17版本
- 提供针对不同Linux发行版(包括RHEL、Debian、Ubuntu等)的专用包
- 支持ARM64和x86_64架构
总结
ParadeDB v0.15.0是一个以性能优化为核心的版本,特别适合处理高并发、大数据量的全文搜索场景。通过底层架构的多项改进,这个版本在查询性能、系统稳定性和维护效率方面都有显著提升。对于已经在使用ParadeDB的用户,升级到这个版本将获得更流畅的搜索体验和更可靠的系统运行。对于考虑采用PostgreSQL全文搜索解决方案的用户,v0.15.0版本提供了一个更加成熟和高效的选择。
登录后查看全文
热门项目推荐
相关项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0193- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
awesome-zig一个关于 Zig 优秀库及资源的协作列表。Makefile00
项目优选
收起
deepin linux kernel
C
27
12
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
601
4.04 K
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
69
21
Ascend Extension for PyTorch
Python
441
531
AscendNPU-IR是基于MLIR(Multi-Level Intermediate Representation)构建的,面向昇腾亲和算子编译时使用的中间表示,提供昇腾完备表达能力,通过编译优化提升昇腾AI处理器计算效率,支持通过生态框架使能昇腾AI处理器与深度调优
C++
112
170
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.46 K
825
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
922
770
暂无简介
Dart
847
204
React Native鸿蒙化仓库
JavaScript
321
375
openGauss kernel ~ openGauss is an open source relational database management system
C++
174
249