NVIDIA NV-Ingest 服务 REST 接口设计与实现

2025-06-29 19:21:58作者：乔或婵

NVIDIA Ingest is an early access set of microservices for parsing hundreds of thousands of complex, messy unstructured PDFs and other enterprise documents into metadata and text to embed into retrieval systems.

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

项目背景

NVIDIA NV-Ingest 是一个高效的数据摄取服务，主要用于处理大规模数据流的接收和处理。随着业务需求的增长，原有的服务接口方式已经不能满足多样化的集成需求。本文将详细介绍如何为 NV-Ingest 服务设计并实现一个基于 FastAPI 的 RESTful 接口，以提供更灵活、标准化的服务接入方式。

架构设计

新的 REST 接口采用 FastAPI 框架构建，主要包含两个核心功能端点：

作业提交端点：接收单个或批量作业请求
结果查询端点：根据作业ID获取处理结果

系统架构采用分层设计，包括：

表现层：处理HTTP请求和响应
业务逻辑层：生成唯一ID、转发作业请求
数据访问层：与底层NV-Ingest服务交互

核心功能实现

作业提交接口

/submit_job 端点实现了以下关键功能：

支持JSON格式的单个或批量作业提交
为每个作业生成唯一UUID标识符
将作业转发至底层NV-Ingest服务
返回包含作业ID的响应

@app.post("/submit_job")
async def submit_job(jobs: List[JobDescription]):
    job_ids = [str(uuid.uuid4()) for _ in jobs]
    # 转发作业到NV-Ingest服务
    await nv_ingest_client.submit_jobs(jobs, job_ids)
    return {"job_ids": job_ids}

结果查询接口

/fetch_job 端点提供：

多作业ID批量查询能力
结果聚合返回
错误处理机制

@app.get("/fetch_job")
async def fetch_job(job_ids: str = Query(...)):
    ids = job_ids.split(",")
    results = await nv_ingest_client.fetch_results(ids)
    return {"results": results}

关键技术点

唯一标识生成

采用UUID v4算法生成作业标识符，确保：

分布式环境下唯一性
无需中央协调
足够的安全性

批量处理优化

针对批量作业场景特别优化：

批量ID预生成减少锁竞争
并行转发提高吞吐量
结果聚合减少网络往返

错误处理机制

完善的错误处理包括：

输入数据验证
服务不可用重试
部分失败处理
详细的错误信息返回

客户端集成

为方便使用，提供了多语言客户端支持：

Python客户端示例

client = NVIngestRESTClient(base_url="http://api.example.com")
job_ids = client.submit_jobs([
    {"data": "job1_data"},
    {"data": "job2_data"}
])
results = client.fetch_results(job_ids)

CLI工具扩展

新增命令行工具支持：

nv-ingest submit --file jobs.json
nv-ingest fetch --ids id1,id2,id3

性能考量

在设计时特别考虑了性能因素：

异步非阻塞IO模型
连接池管理
批量操作优化
轻量级JSON序列化

实际应用场景

该REST接口适用于：

微服务架构集成
跨语言系统调用
自动化流水线
大规模数据处理平台

总结

通过为NV-Ingest服务实现REST接口，显著提升了服务的易用性和集成能力。FastAPI框架的选择确保了高性能和良好的开发体验，而精心设计的接口规范则保证了系统的扩展性和稳定性。这一改进使得NV-Ingest服务能够更好地适应现代云原生架构的需求，为更广泛的应用场景提供了支持。

NeMo-Retriever

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

350

203

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

NVIDIA NV-Ingest 服务 REST 接口设计与实现

项目背景

架构设计

核心功能实现

作业提交接口

结果查询接口

关键技术点

唯一标识生成

批量处理优化

错误处理机制

客户端集成

Python客户端示例

CLI工具扩展

性能考量

实际应用场景

总结

热门内容推荐

最新内容推荐

项目优选

NVIDIA NV-Ingest 服务 REST 接口设计与实现

项目背景

架构设计

核心功能实现

作业提交接口

结果查询接口

关键技术点

唯一标识生成

批量处理优化

错误处理机制

客户端集成

Python客户端示例

CLI工具扩展

性能考量

实际应用场景

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选