Xray-core项目中XHTTP协议上传性能问题分析与优化

2025-05-06 17:13:41作者：伍霜盼Ellen

问题背景

在XTLS/Xray-core项目的实际应用中，用户反馈XHTTP协议（splithttp）在低带宽上传环境（如ADSL线路）下存在严重的上传性能问题。具体表现为当客户端上传带宽低于1Mbps时，文件上传过程会出现长时间延迟甚至完全无法启动的情况，而下载性能则表现正常。

问题现象

通过用户测试发现，当使用XHTTP协议的packet-up模式时，在以下场景会出现问题：

无论是否使用TLS加密
无论是HTTP/1.1、HTTP/2还是HTTP/3协议
无论是否通过CDN中转
在直接连接（client-server）模式下

相比之下，stream-up模式在各种情况下都能正常启动上传，只是速度较慢但不会出现完全卡死的情况。

技术分析

经过开发团队深入分析，发现问题可能源于以下几个方面：

Back Pressure机制不足：XHTTP协议的packet-up模式默认配置为1MB数据块大小和100并发，这意味着理论上需要100MB的上传缓冲区。在低带宽环境下，这种配置会导致数据积压。
HTTP请求处理顺序问题：后调用的client.Do()可能获得更高优先级，导致前面的数据包还未传输完成就被后面的请求抢占，特别是在小带宽情况下尤为明显。
QUIC协议实现问题：项目中使用的quic-go版本可能存在缺陷，特别是在处理HTTP/3上传时表现更差。
数据包重组问题：服务端在处理乱序到达的数据包时可能出现问题，尤其是在通过CDN中转时，数据包可能以非预期顺序到达。

解决方案与优化

开发团队提出了多种优化方案：

调整数据块大小：将scMaxEachPostBytes参数从默认的1MB(1000000)调整为更小的值：
- 100000（0.1MB）→ 理论最大上传速度3MB/s
- 10000（0.01MB）→ 理论最大上传速度0.3MB/s
- 1000（0.001MB）→ 理论最大上传速度0.03MB/s
增加请求间隔：调整scMinPostsIntervalMs参数（如设为100ms），确保前一个POST请求的数据已写入系统网络栈后再发起下一个请求。
实现WroteRequest追踪：在HTTP/2实现中加入等待机制，确保数据完全写入网络栈后再处理下一个请求。
协议选择建议：在低带宽环境下优先使用HTTP/2而非HTTP/3，因为当前HTTP/3实现存在更多稳定性问题。

实际效果验证

经过用户测试验证：

将scMaxEachPostBytes设为50000-100000时，HTTP/2上传基本可以正常工作
增加scMinPostsIntervalMs参数后，上传稳定性得到提升
HTTP/3上传问题仍然存在，建议暂时避免在低带宽环境下使用

技术原理深入

理解这个问题需要了解几个关键技术点：

Back Pressure机制：这是指在数据传输过程中，接收方通过某种方式向发送方反馈当前处理能力，防止发送方过度发送导致数据积压。在低带宽环境下，合理的Back Pressure尤为重要。
HTTP协议特性：
- HTTP/1.1的队头阻塞问题
- HTTP/2的多路复用特性
- HTTP/3基于QUIC的传输机制
系统网络栈：数据从应用程序到网卡的实际传输过程，包括系统缓冲区管理等。

最佳实践建议

基于以上分析，对于使用Xray-core XHTTP协议的用户，特别是在低带宽环境下，建议：

优先使用HTTP/2协议而非HTTP/3
适当减小scMaxEachPostBytes参数值（建议从100000开始测试）
设置合理的scMinPostsIntervalMs值（如100ms）
监控系统资源使用情况，特别是内存占用
对于关键业务，考虑使用stream-up模式作为替代方案

未来优化方向

开发团队计划在以下方面继续优化：

升级quic-go库以改善HTTP/3支持
完善Back Pressure机制实现
增加更细粒度的流量控制参数
优化服务端数据包重组算法

通过这些优化，Xray-core项目将能够在各种网络环境下提供更稳定可靠的服务。

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

RuoYi-Cloud-Vue3

🎉 基于Spring Boot、Spring Cloud & Alibaba、Vue3 & Vite、Element Plus的分布式前后端分离微服务架构权限管理系统

昇腾LLM分布式训练框架