NVIDIA nv-ingest项目新增Milvus批量导入功能解析

2025-06-29 08:38:48作者：裴锟轩Denise

NeMo Retriever Library is a scalable, performance-oriented document content and metadata extraction microservice. NeMo Retriever Library uses specialized NVIDIA NIM microservices to find, contextualize, and extract text, tables, charts and images that you can use in downstream generative applications.

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

背景介绍

NVIDIA的nv-ingest项目是一个数据摄取和处理工具，主要用于将大规模数据高效地导入到向量数据库(Vector Database)中。在最新版本中，项目团队针对Milvus向量数据库的批量导入功能进行了重要升级。

原有痛点分析

在之前的版本中，nv-ingest项目仅支持流式(streaming)数据导入方式。这种方式在处理小规模数据时表现良好，但当用户需要导入大规模语料库时，存在以下明显问题：

导入时间过长：流式处理需要逐条处理数据，无法充分利用系统资源
网络开销大：频繁的小数据包传输导致网络利用率低
系统负载不均衡：持续的资源占用可能导致系统响应变慢

解决方案设计

新版本引入了批量导入(bulk ingest)功能，主要包含以下技术实现：

配置开关：通过VDBTask(bulk=True)参数显式启用批量导入模式
MinIO中间存储：新增MinIO作为临时存储层，先将生成的embedding暂存
批量上传机制：积累到一定数据量后统一上传至Milvus

技术实现细节

架构改进

批量导入功能的实现涉及以下核心组件：

数据处理流水线：保持原有处理逻辑，但增加批量缓存机制
MinIO集成：作为临时存储层，解决内存限制问题
并发控制：优化批量上传时的并发参数，提高吞吐量

性能优化

相比流式处理，批量导入带来了显著的性能提升：

网络利用率提高：减少TCP握手和协议开销
数据库写入优化：批量提交减少事务开销
资源利用率提升：更均衡的CPU/GPU负载

使用场景建议

根据实际测试结果，建议在以下场景优先使用批量导入：

初始数据导入：当需要构建完整索引时
大规模更新：需要更新超过10万条记录时
离线处理场景：不要求实时性的后台任务

未来展望

虽然当前实现已经解决了主要性能问题，但仍有优化空间：

自动切换机制：根据数据量动态选择流式或批量
断点续传：增强大规模导入的可靠性
更细粒度的并行控制：针对不同硬件配置自动优化

这一功能的加入使得nv-ingest项目在处理工业级向量数据时具备了更强的竞争力，为构建大规模AI应用提供了更高效的数据处理能力。

NeMo-Retriever

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

470

471

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

2.14 K

224