LoxiLB项目中TCP负载均衡DSR高可用模式的技术解析

2025-07-10 11:10:30作者：袁立春Spencer

背景介绍

LoxiLB是一个高性能的负载均衡器项目，它支持多种负载均衡模式。其中TCP负载均衡的直接服务器返回(DSR)模式是一种常见的高性能负载均衡方案。在DSR模式下，后端服务器直接响应客户端请求，绕过负载均衡器，从而减轻负载均衡器的压力并提高整体性能。

问题现象

在LoxiLB v0.9.0版本中，用户报告了tcplbl3dsrha(三节点DSR高可用)场景下的运行问题。具体表现为：

主机无法正常启动，VIP(Virtual IP)无法响应请求
验证脚本尝试访问端点(EP)时出现路由问题
存在ICMP重定向导致的网络环路
负载均衡器接收到SYN包后出现路由环路

技术分析

路由配置问题

在初始实现中，路由器R1缺少到端点EP1-3(56.56.56.1等)的路由，只有负载均衡器(LLB)拥有这些路由。这导致验证脚本无法正确访问后端服务器。解决方案是在路由器上添加适当的路由配置。

ICMP重定向问题

系统默认启用了ICMP重定向功能，这会导致网络环路。当客户端(用户容器)尝试ping VIP时，会收到ICMP重定向消息，随后产生路由环路。临时解决方案是禁用容器内的ICMP重定向功能。

BGP ECMP配置缺失

路由器R1默认没有启用等价多路径路由(ECMP)，导致只能选择单一路径。通过添加"maximum-paths 4"配置，可以启用多路径路由，提高网络可靠性和性能。

未定义流量的处理

LoxiLB默认只处理已定义的VIP+服务端口组合流量，其他流量会被忽略。这导致ping VIP等未定义流量被错误路由。解决方案有两种：

在负载均衡器上手动添加VIP地址：ip addr add 20.20.20.1/32 dev lo
为VIP创建ICMP类型的负载均衡规则

解决方案与改进

开发团队已经修复了主要问题：

更新了CI/CD场景配置，跳过了对端点EP1-3的直接连接检查
修复了EP3的设置问题
改进了代码实现，确保DSR高可用模式正常工作

对于未来版本，团队考虑以下改进：

默认禁用ICMP重定向功能
实现未定义流量的黑洞处理模式，提高安全性
优化BGP配置模板，自动启用ECMP

最佳实践建议

对于使用LoxiLB DSR高可用模式的用户，建议：

确保所有网络设备配置了正确的路由
在容器环境中禁用ICMP重定向
为BGP对等体配置ECMP支持
为所有需要通过负载均衡器访问的服务明确定义规则
在负载均衡器节点上配置VIP地址

总结

LoxiLB的TCP负载均衡DSR高可用模式提供了高性能的负载均衡解决方案。通过解决路由配置、ICMP重定向和ECMP支持等问题，该模式已能稳定工作。未来版本将继续优化默认配置和未定义流量的处理，提供更安全、更可靠的负载均衡服务。

loxilb

eBPF based cloud-native load-balancer. Powering K8s|Edge|5G|IoT|XaaS Apps.

项目地址：https://gitcode.com/gh_mirrors/lo/loxilb

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

115

141