NVIDIA nv-ingest项目：集群内直接访问微服务的实践指南

2025-06-29 17:45:45作者：舒璇辛Bertina

NVIDIA Ingest is an early access set of microservices for parsing hundreds of thousands of complex, messy unstructured PDFs and other enterprise documents into metadata and text to embed into retrieval systems.

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

在Kubernetes集群中使用NVIDIA nv-ingest项目时，开发者经常需要与微服务进行交互。虽然官方提供了nv-ingest-cli工具，但在生产环境中，直接通过命令行与微服务交互往往更为高效和可靠。本文将详细介绍如何在Kubernetes集群内部直接访问nv-ingest微服务，避免使用端口转发(port-forwarding)带来的限制。

为什么需要集群内直接访问

端口转发虽然方便，但在生产环境中存在几个显著问题：

稳定性不足：连接容易中断
安全性隐患：暴露了不必要的网络端口
性能瓶颈：不适合处理大量数据
依赖本地环境：要求开发者机器能访问集群

集群内访问的基本原理

在Kubernetes集群内部，服务之间可以通过Service名称直接通信。每个Service都会被分配一个内部DNS名称，格式为<service-name>.<namespace>.svc.cluster.local。利用这一特性，我们可以直接从Pod内部访问nv-ingest服务。

实践方法

1. 使用临时Pod进行交互

创建一个临时Pod，使用curl等工具直接访问服务：

kubectl run -it --rm debug-pod --image=curlimages/curl --restart=Never -- /bin/sh

进入Pod后，可以使用以下命令测试服务：

curl http://nv-ingest-service.nv-ingest-namespace.svc.cluster.local:8080/api/v1/health

2. 通过kubectl exec直接执行命令

对于已经存在的Pod，可以直接执行命令：

kubectl exec -it existing-pod -- curl http://nv-ingest-service:8080/api/v1/data

3. 创建专用客户端Pod

对于频繁交互的场景，可以创建专用的客户端Pod：

apiVersion: v1
kind: Pod
metadata:
  name: nv-ingest-client
spec:
  containers:
  - name: client
    image: appropriate/curl
    command: ["/bin/sh", "-c", "while true; do sleep 3600; done"]

创建后进入Pod进行交互：

kubectl exec -it nv-ingest-client -- /bin/sh

高级用法

1. 处理认证和授权

如果服务需要认证，可以在请求中添加token：

curl -H "Authorization: Bearer $(cat /var/run/secrets/kubernetes.io/serviceaccount/token)" \
  https://nv-ingest-service:8080/api/v1/data

2. 使用服务账户权限

确保Pod有适当的服务账户和RBAC权限：

apiVersion: v1
kind: ServiceAccount
metadata:
  name: ingest-client-sa
---
apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  name: ingest-client-rb
subjects:
- kind: ServiceAccount
  name: ingest-client-sa
roleRef:
  kind: ClusterRole
  name: view
  apiGroup: rbac.authorization.k8s.io

3. 处理TLS连接

如果服务启用了TLS，需要使用CA证书：

curl --cacert /var/run/secrets/kubernetes.io/serviceaccount/ca.crt \
  https://nv-ingest-service:8443/api/v1/health

生产环境建议

使用服务网格：考虑集成Istio或Linkerd等服务网格解决方案，简化服务间通信
实施重试机制：在客户端代码中添加适当的重试逻辑
监控和日志：确保所有交互都有适当的日志记录和监控
资源限制：为客户端Pod设置适当的资源限制

常见问题排查

连接被拒绝：检查服务是否正常运行，端口是否正确
DNS解析失败：验证集群DNS服务是否正常工作
认证失败：检查服务账户和RBAC配置
TLS握手错误：确认使用的CA证书是否正确

通过以上方法，开发者可以在生产环境中安全、高效地与nv-ingest微服务进行交互，避免了端口转发的各种限制，同时提高了系统的可靠性和安全性。

NeMo-Retriever

项目地址：https://gitcode.com/GitHub_Trending/nv/NeMo-Retriever

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理