Milvus数据库中的Upsert操作与计数查询问题分析

2025-05-04 02:40:24作者：卓炯娓

问题背景

在Milvus数据库的2.5版本中，当用户对已存在主键的数据执行Upsert操作后，使用count(*)查询时发现返回的结果数量大于预期值。这一现象在并发操作环境下尤为明显，给用户带来了数据一致性的困扰。

技术原理分析

Milvus作为一款向量数据库，其数据操作机制与传统关系型数据库有所不同。当执行Upsert操作时，系统实际上采用了"先标记删除再插入"的策略，而非直接覆盖原有数据。

Upsert的内部机制

软删除机制：Milvus对Upsert操作采用软删除方式，原有数据并不会立即物理删除，而是被标记为删除状态
数据版本控制：系统会保留新旧两个版本的数据，直到后续的压缩(compaction)操作才会真正清理被标记删除的数据
查询可见性：在查询时，系统会自动过滤掉被标记删除的记录，但对count(*)这类聚合操作可能有特殊处理

问题根源

经过深入分析，发现导致计数不准确的主要原因包括：

删除操作丢失：在数据加载过程中，部分删除操作可能未被正确处理，特别是在L0压缩之前
多段数据合并：当数据分布在多个segment时，重复主键可能被分别计数
流节点异常：在启用流节点的部署中，如果发生pod被意外终止，可能导致segment被错误标记为不可见，影响数据过滤

解决方案与优化

针对这一问题，开发团队已经提出了多项改进措施：

压缩策略优化：确保删除操作在压缩过程中被正确处理
查询一致性增强：推荐使用Strong一致性级别进行计数查询，可获得更准确结果
流节点稳定性修复：解决了pod异常导致segment标记错误的问题
计数逻辑改进：优化了count(*)操作的实现，使其能正确合并重复主键

最佳实践建议

对于使用Milvus的开发人员，建议采取以下措施避免类似问题：

合理设置一致性级别：对计数准确性要求高的场景使用Strong一致性
监控压缩过程：关注系统压缩操作的执行情况和性能指标
版本升级：及时更新到包含相关修复的版本
测试验证：在重要操作前后进行数据一致性验证

总结

数据库系统中的数据操作与查询一致性是保证业务可靠性的关键。Milvus团队通过深入分析Upsert操作与计数查询的交互机制，找出了问题的根本原因并提供了有效的解决方案。这一案例也提醒我们，在使用新型数据库系统时，理解其底层机制对于问题排查和性能优化至关重要。

milvus

Milvus is a high-performance, cloud-native vector database built for scalable vector ANN search

项目地址：https://gitcode.com/GitHub_Trending/mi/milvus

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

579

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java