NVIDIA nv-ingest项目新增SimpleMessageBroker的设计解析

2025-06-29 04:00:34作者：伍希望

NVIDIA Ingest is an early access set of microservices for parsing hundreds of thousands of complex, messy unstructured PDFs and other enterprise documents into metadata and text to embed into retrieval systems.

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

背景与需求分析

在现代数据处理流水线中，消息中间件作为系统解耦的关键组件被广泛使用。NVIDIA的nv-ingest项目当前采用Redis作为默认消息代理，这种架构虽然成熟可靠，但在测试验证和概念验证(POC)场景中却存在两个显著痛点：

环境依赖复杂：需要额外部署消息代理容器和前端REST服务
资源开销大：对于简单测试场景，完整消息队列系统显得过于"重量级"

架构设计方案

核心组件设计

项目团队提出了一种轻量级的嵌入式消息代理方案，主要包含两大核心组件：

socket_task_source：
- 作为任务接收端点
- 监听配置指定的网络端口
- 实现消息队列的入队接口
socket_task_sink：
- 作为结果输出端点
- 提供任务结果查询接口
- 支持长连接保持和结果推送

客户端适配方案

配套的nv_ingest_client将同步升级，新增以下功能特性：

支持通过TCP/UDP套接字直接提交任务
提供异步结果回调机制
内置连接重试和超时控制
可配置的负载均衡策略（当部署多个实例时）

技术实现亮点

零依赖架构

该设计最显著的优势是移除了对外部中间件的依赖：

无需部署Redis等消息中间件
取消对REST服务的强制要求
单二进制即可完成完整功能

性能优化设计

考虑到嵌入式方案的特点，实现中特别注重：

内存环形缓冲区：避免频繁内存分配
零拷贝传输：减少数据序列化开销
事件驱动模型：基于epoll/kqueue实现高并发

协议设计

采用精简的二进制协议格式：

固定长度消息头（包含消息类型和负载长度）
可扩展的元数据区
采用CRC32校验保证数据完整性

应用场景分析

该方案特别适合以下场景：

本地开发测试：开发者可以快速启动完整流水线
边缘计算场景：资源受限环境下的轻量级部署
CI/CD流水线：简化自动化测试环境配置
快速概念验证：客户演示时的极简部署方案

未来演进方向

虽然当前设计已满足基本需求，但技术团队规划了以下增强路线：

支持Unix Domain Socket：提升本地通信效率
增加QUIC协议支持：优化高延迟网络环境
实现消息持久化：可选的消息落盘功能
集群模式：多节点间的自动发现和负载均衡

这种轻量级消息代理的设计体现了NVIDIA在保持系统核心能力的同时，对开发者体验和部署灵活性的高度重视，为不同应用场景提供了更丰富的架构选择。

NVIDIA Ingest is an early access set of microservices for parsing hundreds of thousands of complex, messy unstructured PDFs and other enterprise documents into metadata and text to embed into retrieval systems.

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统