Apollo项目流媒体传输卡顿问题的分析与解决方案

2025-06-26 21:45:33作者：冯梦姬Eddie

Sunshine fork - The easiest way to stream with the native resolution of your client device

项目地址：https://gitcode.com/gh_mirrors/apollo18/Apollo

问题现象描述

近期在Apollo项目(版本0.27和0.29-alpha.1)使用过程中，用户报告了一个特殊的流媒体传输问题。在运行特定游戏(如FFVII Rebirth)时，流媒体传输会在5-25分钟后出现卡顿现象。一旦首次卡顿发生后，后续每次重连都会持续卡顿，直到完全重启Apollo服务才能恢复正常。

系统环境分析

出现该问题的系统配置如下：

CPU: AMD Ryzen 7 3700x
GPU: Nvidia RTX 4070
操作系统: Windows 11 22H2
内存: 16GB DDR5
编码器: hevc_nvenc
显示设置: 3840x2160@60Hz HDR

技术诊断过程

从日志分析可以看出，系统在卡顿后最终会记录"Fatal: Hang detected! Session failed to terminate in 10 seconds"错误。同时观察到系统还伴随出现DXGI_ERROR_DEVICE_REMOVED错误，这表明可能存在图形设备层面的问题。

经过深入排查，发现问题可能与以下因素相关：

硬件加速GPU调度(HAGS)：Windows的硬件加速GPU调度功能在高负载场景下可能导致稳定性问题。
GPU负载过高：特定游戏(如FFVII Rebirth)对GPU资源占用较高，可能导致编码器资源不足。
驱动兼容性：虽然用户已更新至最新NVIDIA驱动，但某些游戏特定优化可能仍存在兼容性问题。

解决方案

针对这一问题，推荐采取以下解决方案：

禁用硬件加速GPU调度(HAGS)：
- 打开Windows设置 > 系统 > 显示 > 图形设置
- 关闭"硬件加速GPU调度"选项
- 重启系统使设置生效
优化游戏图形设置：
- 适当降低游戏分辨率和画质设置
- 关闭非必要的后期处理效果
- 限制帧率以减少GPU负载
系统级优化：
- 确保系统电源计划设置为"高性能"
- 检查并关闭可能干扰的后台进程
- 考虑增加系统虚拟内存设置

问题根源分析

该问题本质上是由GPU资源竞争导致的。当运行高负载游戏时，游戏本身占用了大量GPU资源，导致编码器无法及时获取足够资源进行视频编码，从而引发传输卡顿。禁用HAGS可以改善资源调度策略，减少这种资源竞争情况的发生。

预防措施

为避免类似问题再次发生，建议：

对于高负载应用，提前进行性能测试
建立系统监控机制，实时观察GPU利用率
定期更新显卡驱动和Apollo版本
针对不同应用场景建立不同的编码预设

结论

通过禁用硬件加速GPU调度功能，该问题得到了有效解决。这为处理类似的高负载场景下的流媒体传输问题提供了有价值的参考方案。对于Apollo项目用户而言，在高负载应用场景下适当调整系统设置是保证流媒体稳定传输的重要措施。

Sunshine fork - The easiest way to stream with the native resolution of your client device

项目地址：https://gitcode.com/gh_mirrors/apollo18/Apollo

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

昇腾LLM分布式训练框架