OPNsense核心项目：DEC850设备在24.7版本中的10G吞吐量性能问题分析

2025-06-20 04:24:39作者：温艾琴Wonderful

问题背景
在OPNsense 24.7版本升级后，DEC850设备的10G网络吞吐性能出现显著下降。用户报告称，相较于24.1版本，新版本在相同测试条件下会出现CPU核心负载飙升（部分核心达到100%）和吞吐量降低的现象（从9.4Gbps降至8.8Gbps）。该问题在降级至早期版本后消失，表明与FreeBSD 14.1底层变更存在关联。

技术现象
通过iperf3多线程测试可稳定复现以下特征：

性能波动：测试初期可达预期吞吐，但随时间推移性能下降
CPU负载异常：网络线程（if_io_tqg）无法有效分散到多核，导致部分核心持续满载
重启敏感性：重启设备后性能暂时恢复，暗示存在资源管理或调度策略问题

根因分析
深入排查发现关键配置差异：

RSS（接收端缩放）配置不完整：虽然网卡驱动层启用了RSS（dev.ax.X.rss_enabled=1），但系统级RSS未激活（net.inet.rss.enabled默认关闭）
FreeBSD 14.1调度策略变化：新版本对流量分配策略更敏感，未启用全局RSS时无法有效利用netisr线程进行负载均衡

解决方案
通过以下调整可彻底解决问题：

# 启用系统级RSS负载均衡
sysctl net.inet.rss.enabled=1
# 确认网卡RSS配置（DEC850默认已设置）
sysctl dev.ax.0.rss_enabled=1 dev.ax.1.rss_enabled=1

技术原理补充

RSS工作机制：通过哈希算法将网络流分散到不同CPU队列，避免单核瓶颈
netisr线程作用：作为FreeBSD的网络中断处理框架，负责将数据包从驱动层传递到协议栈
版本差异影响：24.7版本中，未启用全局RSS时流量分配更依赖驱动实现，而AX驱动在特定场景下存在核心绑定问题

最佳实践建议
对于10Gbps及以上网络环境，建议：

始终启用系统级和网卡级RSS
监控top -CHIPSn输出，确认netisr线程参与负载均衡
对于多流测试，保持并发数（-P参数）不低于CPU物理核心数
定期检查网络缓冲区和队列设置（如iflib.override_nrxds等参数）

结论
该案例揭示了网络性能调优中硬件、驱动和系统策略的协同重要性。OPNsense 24.7版本对底层网络栈的优化使得配置完整性更为关键，正确的RSS配置能充分发挥DEC850的8核处理能力。这为高性能网络环境下的系统调优提供了典型参考。

core

OPNsense GUI, API and systems backend

项目地址：https://gitcode.com/gh_mirrors/core73/core

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140