Milvus 2.5版本中混合搜索的批处理大小不一致问题分析与解决

2025-05-04 00:22:18作者：袁立春Spencer

问题背景

在Milvus 2.4和2.5版本中，用户在执行混合搜索(hybrid_search)操作时遇到了一个关键错误："expr processed rows not equal expect batch size"。这个错误表明系统在处理批处理数据时出现了不一致，实际处理的行数与预期批处理大小不匹配。

问题现象

当用户在Milvus集群环境中执行以下操作流程时会出现此问题：

创建包含多种字段类型的集合：包括浮点向量(128维)、稀疏浮点向量、JSON字段、整型字段和动态字段
分别为不同字段建立索引：IVF_FLAT用于浮点向量、SPARSE_WAND用于稀疏浮点向量、INVERTED用于整型字段
插入500万条数据并刷新集合
重新构建相同参数的索引
加载集合
并发执行搜索和混合搜索请求

错误信息显示，系统预期处理8192行数据，但实际只处理了7296行(在2.4版本)或4728行(在2.5版本)，导致断言失败。

技术分析

根本原因

这个问题源于Milvus内部执行引擎在处理过滤条件时的批处理逻辑缺陷。具体来说：

在表达式求值过程中，BinaryArithOpEvalRangeExpr.cpp文件中的断言检查发现处理的行数与预期批大小不匹配
问题特别出现在混合搜索操作中，当同时处理向量搜索和标量过滤条件时
2.4版本和2.5版本都受到影响，但错误发生的具体位置略有不同(行号变化)

影响范围

该问题影响以下场景：

使用混合搜索功能的用户
数据集规模较大的情况(如500万条记录)
同时包含向量和标量搜索条件的查询
使用JSON字段和动态字段的复杂过滤条件

解决方案

Milvus开发团队已经识别并修复了这个问题。修复方案主要涉及：

重新审视批处理逻辑，确保在处理过滤条件时保持一致的批处理大小
优化表达式求值引擎中的行数计算逻辑
增强错误处理机制，提供更清晰的错误信息

验证结果

修复后的2.5版本(2.5-20250320-14259a3f-amd64及之后版本)已经通过了全面测试：

直接在新版本上准备数据并执行并发查询操作，问题不再出现
从2.4版本升级到修复后的2.5版本，混合搜索功能工作正常

最佳实践建议

对于使用Milvus混合搜索功能的用户，建议：

升级到已修复该问题的2.5版本
对于复杂查询条件，建议分阶段测试查询性能
监控查询执行情况，特别是处理大规模数据集时
合理设置批处理大小参数，避免极端值

总结

Milvus作为一款高性能向量数据库，其混合搜索功能在处理复杂查询场景时非常有用。这次发现的批处理大小不一致问题虽然影响特定使用场景，但通过团队的快速响应和修复，确保了系统的稳定性和可靠性。用户升级到修复版本后可以继续安全地使用混合搜索功能。

milvus

Milvus is a high-performance, cloud-native vector database built for scalable vector ANN search

项目地址：https://gitcode.com/GitHub_Trending/mi/milvus

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

425

376

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.65 K

971

Milvus 2.5版本中混合搜索的批处理大小不一致问题分析与解决

问题背景

问题现象

技术分析

根本原因

影响范围

解决方案

验证结果

最佳实践建议

总结

热门内容推荐

最新内容推荐

项目优选

Milvus 2.5版本中混合搜索的批处理大小不一致问题分析与解决

问题背景

问题现象

技术分析

根本原因

影响范围

解决方案

验证结果

最佳实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选