首页
/ ParadeDB v0.15.9版本发布:全文搜索扩展的重大更新

ParadeDB v0.15.9版本发布:全文搜索扩展的重大更新

2025-06-08 23:17:18作者:宣海椒Queenly

ParadeDB是一个基于PostgreSQL的高性能全文搜索扩展,它通过原生集成到PostgreSQL中,为用户提供了强大的搜索能力。与传统的PostgreSQL全文搜索相比,ParadeDB在性能、功能和易用性方面都有显著提升。

本次发布的v0.15.9版本带来了多项重要改进和功能增强,主要集中在索引合并策略优化、性能提升和bug修复等方面。这些改进使得ParadeDB在处理大规模数据时的表现更加出色,特别是在高并发写入场景下的稳定性有了明显提升。

核心改进:全新的合并策略

v0.15.9版本引入了一个革命性的"LayeredMergePolicy"合并策略,取代了原有的"NPlusOneMergePolicy"。这一变化是本次更新的最大亮点。

在全文搜索引擎中,合并策略决定了如何将多个小的索引段(segment)合并成更大的段,这对查询性能和写入吞吐量都有重大影响。新的LayeredMergePolicy采用了分层合并的方式,能够更高效地组织索引结构,特别是在处理大量小文档或频繁更新的场景下。

与旧策略相比,LayeredMergePolicy具有以下优势:

  1. 支持并发合并操作,显著提高了索引构建和更新的效率
  2. 更智能的段选择策略,减少了不必要的合并操作
  3. 更好的资源利用率,降低了CPU和I/O开销
  4. 更平滑的性能曲线,避免了旧策略可能导致的性能波动

重要功能增强

除了核心的合并策略改进外,v0.15.9版本还包含以下重要功能增强:

  1. 片段生成优化:修复了片段生成功能中max_num_chars参数不生效的问题,现在可以更精确地控制返回的文本片段长度。

  2. 字符串快速字段处理:修复了StringFastFieldExec方法在某些情况下会丢失数据行的问题,提高了数据检索的准确性。

  3. 批量更新性能:新增了针对批量更新操作的性能测试工具(stressgres),帮助开发者更好地评估和优化大规模数据更新的性能。

兼容性与部署改进

v0.15.9版本在兼容性和部署方面也做了重要调整:

  1. PostgreSQL版本支持:移除了对PostgreSQL 13的支持,现在最低支持版本为PostgreSQL 14。这一变化使得开发团队能够更专注于新特性的开发,而不必维护旧版本的兼容性。

  2. 依赖管理:锁定了pgrx(PostgreSQL Rust扩展框架)的版本,提高了构建的稳定性和可重复性。

  3. 打包优化:为各种Linux发行版和PostgreSQL版本提供了更全面的预编译包,包括对最新PostgreSQL 17的初步支持。

移除的功能

出于简化和聚焦核心功能的考虑,v0.15.9版本移除了以下功能:

  1. 遥测功能:完全移除了产品中的遥测数据收集功能,进一步提升了用户隐私保护。

开发者体验改进

对于使用ParadeDB进行开发的工程师,这个版本也带来了多项体验改进:

  1. 更稳定的API:修复了多个边界条件下的bug,提高了接口的可靠性。

  2. 增强的测试覆盖:新增了针对片段生成和字符串字段处理的测试用例,确保这些核心功能的稳定性。

  3. 文档更新:详细记录了新的合并策略API和使用方法,帮助开发者更好地理解和利用这些新特性。

升级建议

对于正在使用ParadeDB的用户,建议尽快升级到v0.15.9版本,特别是那些面临以下场景的项目:

  • 需要处理高频率数据更新的应用
  • 查询性能出现波动的系统
  • 计划迁移到PostgreSQL 16或17的环境

升级过程相对简单,可以通过各Linux发行版的包管理器直接安装新版本。需要注意的是,由于合并策略的变化,首次使用新版本时可能需要重建索引以获得最佳性能。

总的来说,ParadeDB v0.15.9版本通过创新的合并策略和多项功能优化,进一步巩固了其作为PostgreSQL高性能全文搜索解决方案的地位。这些改进使得它能够更好地服务于需要处理大规模文本数据的现代应用场景。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
139
1.91 K
kernelkernel
deepin linux kernel
C
22
6
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
192
273
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
923
551
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
421
392
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
145
189
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Jupyter Notebook
74
64
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
344
1.3 K
easy-eseasy-es
Elasticsearch 国内Top1 elasticsearch搜索引擎框架es ORM框架,索引全自动智能托管,如丝般顺滑,与Mybatis-plus一致的API,屏蔽语言差异,开发者只需要会MySQL语法即可完成对Es的相关操作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo,嵌套,父子类型等功能...
Java
36
8