ZLMediaKit UDP推流丢包问题分析与解决方案

2025-05-15 21:45:26作者：翟萌耘Ralph

问题背景

在使用ZLMediaKit进行多路国标推流时，用户遇到了UDP推流丢包的问题。具体表现为接收端日志中出现大量RTP丢包警告，但奇怪的是发送端的抓包分析显示序列号不连续，而接收端解码却没有报错。

问题现象分析

通过抓包分析发现，UDP数据包在传输过程中确实存在序列号不连续的情况。主要表现特征包括：

接收端日志频繁出现"rtp丢包"警告
抓包结果显示序列号跳跃
解码器端未报告错误
网络接口统计未显示TX_DROP

根本原因

经过深入分析，发现问题根源在于ZLMediaKit的UDP发送机制设计：

单线程发送瓶颈：ZLMediaKit默认采用单线程发送多路RTP流，当推流路数过多时，单线程处理能力达到瓶颈
无发送间隔控制：代码中没有对UDP发送速率进行主动控制，可能导致短时间内大量数据包涌入网络栈
UDP协议特性：UDP本身是无连接的不可靠协议，在网络拥塞时会出现丢包

解决方案

针对这一问题，我们提出以下解决方案：

1. 增加发送间隔控制

在RtpSender.cpp中增加发送间隔控制逻辑，强制每包发送间隔不小于2ms：

if (_rtp_send_ticker.elapsedTime() <= 2) {
    usleep(2);
}
_socket_rtp->send(std::make_shared<BufferRtp>(std::move(packet), RtpPacket::kRtpTcpHeaderSize), nullptr, 0, ++i == size);
_rtp_send_ticker.resetTime();

2. 分流发送策略

更优的解决方案是将推流任务分散到多个源：

将500路推流分成50个源
每个源负责10路推流
通过负载均衡实现并行发送

这种架构可以充分利用多核CPU性能，避免单线程瓶颈。

技术原理深入

UDP发送性能考量

UDP发送性能受多种因素影响：

系统缓冲区：每个UDP socket都有发送缓冲区，大小可通过系统参数调整
网络栈处理能力：内核网络协议栈处理能力有限
网卡队列深度：网卡本身的发送队列深度会影响丢包率

性能优化建议

对于高并发UDP推流场景，建议进行以下系统优化：

调整内核网络参数：

net.core.wmem_max = 167772160
net.core.rmem_max = 167772160
net.core.wmem_default = 16777216
net.core.rmem_default = 16777216

监控网络接口统计：
```
ifconfig
ethtool -S eth0
```
使用多线程架构分散发送压力

结论

ZLMediaKit作为高性能流媒体服务器，在常规使用场景下表现优异。但在极端高并发UDP推流场景下，需要特别注意发送架构设计。通过合理的分流策略和系统优化，可以有效解决UDP丢包问题，保证流媒体传输质量。

对于开发者而言，理解底层网络协议特性和系统性能瓶颈，是设计高可靠性流媒体系统的关键。

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

454

436

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。