Akvorado项目中GRPC连接数优化实践

2025-07-10 19:05:50作者：凌朦慧Richard

在Akvorado网络流量分析系统的实际部署中，我们发现当使用gNMI协议采集Nokia SROS设备接口信息时，系统会默认建立多个GRPC连接。这可能导致某些对连接数有限制的设备（如最大8个连接）出现资源耗尽的情况。本文深入分析该问题的成因并提供优化方案。

问题现象分析

通过监控发现，Akvorado会为每个设备建立2-3个GRPC连接：

连接1：活跃RPC 0个，总计RPC 6个
连接2：活跃RPC 0个，总计RPC 2个
连接3：活跃RPC 1个，总计RPC 2个

相比之下，其他工具如GNMIC虽然订阅更多路径（55+），但仅使用1个连接就能完成所有操作，说明GRPC连接复用是可行的。

根本原因

Akvorado默认配置会启动多个工作线程（workers）并行处理元数据采集任务。这些工作线程会各自建立独立的GRPC连接，导致连接数随worker数量线性增长。特别是在以下场景中表现明显：

当配置的metadata workers数量超过gNMI设备数量时
同时使用SNMP和gNMI协议时

优化方案

针对纯gNMI采集环境，建议采用以下配置优化：

metadata:
  workers: 1

这一调整将带来以下优势：

每个设备仅维持1个GRPC连接
完全满足gNMI协议的多路径订阅需求
避免触发设备端的连接数限制

技术原理

gNMI协议本身支持在单个连接上复用多个RPC调用。Akvorado通过减少工作线程数，实现了：

连接池的合理化使用
降低设备端资源消耗
保持相同的采集能力

值得注意的是，这种优化对SNMP采集可能有性能影响，但在纯gNMI环境中可以安全使用。对于混合环境（同时使用SNMP和gNMI），需要根据设备比例合理配置worker数量。

实施建议

对于纯gNMI环境：直接将workers设为1
混合环境：workers数不超过gNMI设备数
监控调整后设备的连接数和使用情况

通过这种优化，我们成功解决了Nokia SROS设备的连接数限制问题，同时保证了数据采集的完整性和时效性。这一方案也适用于其他对GRPC连接数敏感的网络设备。

akvorado

Flow collector, enricher and visualizer

项目地址：https://gitcode.com/gh_mirrors/ak/akvorado

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

458

445

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

151

253