Milvus数据库在并发DQL与DML场景下的mmap/ChunkedColumn崩溃问题分析

2025-05-04 22:08:42作者：滑思眉Philip

问题背景

在Milvus数据库的2.5版本中，当系统在并发执行数据查询语言(DQL)和数据操作语言(DML)操作时，出现了严重的崩溃问题。这一问题主要发生在使用mmap/ChunkedColumn处理数据的场景下，特别是在构建BITMAP索引并同时进行多种数据库操作的情况下。

问题现象

根据测试报告，该问题表现为：

系统在并发执行搜索、查询、混合搜索、加载、插入、删除和刷新操作时崩溃
崩溃发生时，系统正在处理包含12种不同标量字段的集合，这些字段都建立了BITMAP索引
集合中还包含两种不同类型的向量字段：128维的浮点向量和稀疏浮点向量
系统在处理约200万条数据时出现异常

技术分析

mmap/ChunkedColumn机制

mmap(内存映射文件)是Milvus中用于高效处理大数据集的一种技术。ChunkedColumn则是Milvus内部用于分块存储列式数据的数据结构。这种组合通常用于提高大数据量的处理效率，但在并发场景下可能出现问题。

并发操作冲突

测试场景中同时执行了多种操作：

搜索操作：基于不同字段的条件搜索
查询操作：带有限制和偏移量的数据检索
混合搜索：结合向量和标量条件的复杂查询
数据操作：包括插入、删除和刷新

这些操作在并发执行时，可能对mmap映射的内存区域产生竞争访问，导致系统崩溃。

BITMAP索引的特殊性

BITMAP索引在处理标量数据时非常高效，但在并发写入和查询场景下，索引维护可能成为瓶颈。特别是当系统同时处理多种类型的标量字段(包括各种整数类型、布尔类型和变长字符串)时，索引更新的复杂性会显著增加。

解决方案与验证

开发团队针对类似问题已经提交了多个修复补丁，主要关注点包括：

修复了处理可空值输入时的崩溃问题
优化了mmap在数据增长时的处理逻辑
改进了并发控制机制

根据后续测试报告，在2.5-20250409版本中，该问题已无法复现，表明相关修复已经生效。测试环境使用了相同的并发测试场景，包括20个并发客户端持续运行3小时的负载测试，系统保持稳定。

最佳实践建议

对于使用Milvus的开发者和运维人员，建议：

在涉及大量并发DQL和DML操作的场景下，使用2.5.7或更高版本
对于包含多种标量字段和BITMAP索引的集合，进行充分的性能测试
监控系统在高并发下的内存使用情况
考虑合理设置操作超时时间，避免长时间阻塞

该问题的解决体现了Milvus团队对系统稳定性的持续改进，也为用户在高并发场景下的使用提供了更可靠的保障。

milvus

A cloud-native vector database, storage for next generation AI applications

项目地址：https://gitcode.com/GitHub_Trending/mi/milvus

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271

Milvus数据库在并发DQL与DML场景下的mmap/ChunkedColumn崩溃问题分析

问题背景

问题现象

技术分析

mmap/ChunkedColumn机制

并发操作冲突

BITMAP索引的特殊性

解决方案与验证

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

Milvus数据库在并发DQL与DML场景下的mmap/ChunkedColumn崩溃问题分析

问题背景

问题现象

技术分析

mmap/ChunkedColumn机制

并发操作冲突

BITMAP索引的特殊性

解决方案与验证

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选