ManticoreSearch优化与更新操作的并发性能改进
背景介绍
ManticoreSearch作为一款高性能的全文搜索引擎,在处理大规模数据时经常需要进行数据更新(UPDATE)和索引优化(OPTIMIZE)操作。然而,在实际使用中发现,当这两个操作同时执行时会出现严重的性能问题——更新操作会被优化操作完全阻塞,导致系统响应时间显著增加。
问题现象
通过一个简单的测试用例可以重现这个问题:首先创建一个包含200万条记录的测试表,然后同时执行OPTIMIZE和UPDATE操作。测试结果显示,即使只是更新单条记录,UPDATE操作也需要等待长达12秒才能完成,完全被OPTIMIZE操作阻塞。
更严重的是,这种阻塞还会影响其他查询操作。例如,在OPTIMIZE和UPDATE同时执行期间,简单的SELECT COUNT(*)查询也需要等待11秒才能返回结果,这显然无法满足生产环境对实时性的要求。
技术分析
经过深入分析,发现这个问题源于ManticoreSearch内部的锁机制设计:
-
全局锁争用问题:OPTIMIZE操作会获取表的共享锁,而UPDATE操作需要获取排他锁。当OPTIMIZE操作正在进行时,UPDATE操作必须等待OPTIMIZE释放锁后才能继续执行。
-
属性复制阶段的锁粒度:在合并磁盘块(disk chunks)的过程中,最耗时的属性复制阶段会持有锁。对于非BLOB属性的更新,只需要等待相关块合并完成;但对于BLOB属性的更新,则需要等待所有块合并完成。
-
锁优先级设计:系统当前采用"写优先"的锁策略,当有写操作等待时,后续的读操作也会被阻塞,这是为了防止写操作被大量读操作"饿死"。
解决方案
开发团队针对这个问题提出了分阶段的优化方案:
第一阶段优化:减少BLOB更新的阻塞范围
通过重构OPTIMIZE任务的执行流程,使其不再需要获取全局索引锁。这样BLOB属性的更新只需要等待相关块的合并完成,而不必等待整个OPTIMIZE操作结束。这一优化显著减少了BLOB更新的等待时间。
第二阶段优化:细化合并过程中的锁粒度
在磁盘块合并过程中,进一步优化了属性复制的锁机制:
- 将长时的属性复制操作分解为多个阶段
- 在保证数据一致性的前提下,增加安全检查点
- 允许UPDATE操作在这些安全检查点处执行
这使得即使是大型表的合并操作,也能保持较高的更新响应速度。
性能对比
优化前后的性能对比非常明显:
优化前:
- BLOB更新:等待所有块合并完成(约12秒)
- 非BLOB更新:等待相关块合并完成(约6秒)
第一阶段优化后:
- BLOB更新:仅等待相关块合并完成
- 非BLOB更新:行为不变
第二阶段优化后:
- 所有更新操作:等待时间大幅减少,基本不影响用户体验
实际应用建议
对于ManticoreSearch用户,建议:
- 及时升级到包含此优化的版本(7.0.0及以上)
- 对于高频更新的场景,可以适当调整OPTIMIZE的执行频率
- 监控系统负载,在低峰期执行大规模的OPTIMIZE操作
- 对于实时性要求高的应用,考虑使用分布式架构分散负载
总结
ManticoreSearch通过精细化的锁机制优化,有效解决了UPDATE操作被OPTIMIZE阻塞的问题。这一改进显著提升了系统在高并发场景下的响应能力,使ManticoreSearch更适合需要实时数据更新的应用场景。开发团队将继续关注系统性能优化,为用户提供更出色的搜索体验。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0153- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
LongCat-Video-Avatar-1.5最新开源LongCat-Video-Avatar 1.5 版本,这是一款经过升级的开源框架,专注于音频驱动人物视频生成的极致实证优化与生产级就绪能力。该版本在 LongCat-Video 基础模型之上构建,可生成高度稳定的商用级虚拟人视频,支持音频-文本转视频(AT2V)、音频-文本-图像转视频(ATI2V)以及视频续播等原生任务,并能无缝兼容单流与多流音频输入。00
auto-devAutoDev 是一个 AI 驱动的辅助编程插件。AutoDev 支持一键生成测试、代码、提交信息等,还能够与您的需求管理系统(例如Jira、Trello、Github Issue 等)直接对接。 在IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。Kotlin03
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0112