超详细Envoy Gateway 1.5实战指南:从部署到流量治理
2026-02-04 04:16:18作者:房伟宁
引言:告别复杂配置,拥抱云原生网关新范式
你是否还在为API网关的复杂配置而头疼?是否在Kubernetes与非K8s环境间切换时面临兼容性难题?Envoy Gateway作为Envoy Proxy的官方管理平面,通过Kubernetes Gateway API(网关应用程序接口)提供了声明式配置能力,让流量管理变得前所未有的简单。本文基于最新v1.5.0版本,带你从零开始部署Envoy Gateway,掌握HTTP/TCP路由、TLS终止、流量分流等核心能力,30分钟即可完成企业级网关的基础搭建。
读完本文你将获得:
- 3种部署模式(Helm/Kustomize/独立模式)的实操步骤
- HTTP路由、TCP代理、TLS加密的完整配置案例
- 基于权重的灰度发布与金丝雀部署实现方案
- 生产环境必备的监控与故障排查指南
一、Envoy Gateway核心价值与架构解析
1.1 为什么选择Envoy Gateway?
Envoy Gateway解决了传统API网关的三大痛点:
- 配置复杂性:通过Gateway API实现声明式配置,替代Envoy原生的xDS(x Discovery Service,x发现服务)复杂配置
- 多环境适配:无缝支持Kubernetes集群与独立部署模式
- 扩展灵活性:保留Envoy Proxy的全部扩展能力,同时提供简化的抽象层
1.2 核心架构与组件关系
flowchart TD
subgraph 控制平面
EG[Envoy Gateway] -->|管理| GC[GatewayClass]
EG -->|翻译| GW[Gateway资源]
EG -->|生成| XDS[Envoy配置]
end
subgraph 数据平面
EP[Envoy Proxy] -->|接收| XDS
EP -->|处理| TRAF[南北向流量]
end
User -->|访问| EP
EP -->|路由| SVC[后端服务]
关键组件说明:
- GatewayClass:集群级资源,定义网关类型与控制器
- Gateway:指定监听端口、协议等网络配置
- HTTPRoute/TCPRoute:定义流量路由规则
- EnvoyProxy:数据平面代理,由控制平面自动管理
二、3种部署模式全攻略(基于v1.5.0)
2.1 Helm快速部署(推荐生产环境)
# 创建命名空间
kubectl create namespace envoy-gateway-system
# 安装最新版Helm chart
helm install eg oci://docker.io/envoyproxy/gateway-helm \
--version v0.0.0-latest \
-n envoy-gateway-system \
--set config.envoyGateway.logging.level.default=debug
如需自定义配置(如修改控制器名称、资源限制),可通过
--set参数覆盖values.yaml值,完整配置项参见官方文档。
2.2 源码编译部署(开发测试场景)
# 克隆仓库
git clone https://gitcode.com/gh_mirrors/gate/gateway.git
cd gateway
# 编译并部署到K8s集群
make kube-deploy TAG=v1.5.0
编译环境要求:
- Go 1.20+
- Docker/Podman
- Kubernetes集群1.24+(启用Gateway API CRD)
2.3 独立模式部署(非K8s环境)
# quickstart.yaml
apiVersion: gateway.networking.k8s.io/v1
kind: GatewayClass
metadata:
name: eg
spec:
controllerName: gateway.envoyproxy.io/gatewayclass-controller
---
apiVersion: gateway.networking.k8s.io/v1
kind: Gateway
metadata:
name: eg
spec:
gatewayClassName: eg
listeners:
- name: http
protocol: HTTP
port: 8888
---
apiVersion: gateway.networking.k8s.io/v1
kind: HTTPRoute
metadata:
name: backend
spec:
parentRefs:
- name: eg
hostnames: ["www.example.com"]
rules:
- matches:
- path: {type: PathPrefix, value: /}
backendRefs:
- group: "gateway.envoyproxy.io"
kind: Backend
name: backend
---
apiVersion: gateway.envoyproxy.io/v1alpha1
kind: Backend
metadata:
name: backend
spec:
endpoints:
- ip: {address: 127.0.0.1, port: 3000}
启动命令:
envoy-gateway server --config-path quickstart.yaml
三、核心功能实战:从基础路由到高级流量控制
3.1 HTTP路由配置:路径匹配与权重分流
基础路由示例:
apiVersion: gateway.networking.k8s.io/v1
kind: HTTPRoute
metadata:
name: example-route
spec:
parentRefs: [{name: example-gateway}]
hostnames: ["example.com"]
rules:
- matches:
- path: {type: PathPrefix, value: /login}
backendRefs:
- name: auth-svc
port: 8080
- backendRefs:
- name: default-svc
port: 8080
金丝雀发布配置:
apiVersion: gateway.networking.k8s.io/v1
kind: HTTPRoute
metadata:
name: canary-route
spec:
parentRefs: [{name: example-gateway}]
hostnames: ["bar.example.com"]
rules:
- matches:
- headers:
- name: env
value: canary
type: Exact
backendRefs:
- name: bar-canary-svc
port: 8080
- backendRefs:
- name: bar-svc
port: 8080
3.2 TCP流量代理:端口映射与服务暴露
apiVersion: gateway.networking.k8s.io/v1
kind: Gateway
metadata:
name: tcp-gateway
spec:
gatewayClassName: eg
listeners:
- name: mysql
protocol: TCP
port: 3306
allowedRoutes:
kinds: [{kind: TCPRoute}]
---
apiVersion: gateway.networking.k8s.io/v1alpha2
kind: TCPRoute
metadata:
name: mysql-route
spec:
parentRefs:
- name: tcp-gateway
sectionName: mysql
rules:
- backendRefs:
- name: mysql-service
port: 3306
3.3 TLS终止:安全加密配置实践
1. 创建自签名证书(测试用):
openssl req -x509 -nodes -days 365 -newkey rsa:2048 \
-keyout tls.key -out tls.crt \
-subj "/CN=www.example.com"
kubectl create secret tls example-cert --cert=tls.crt --key=tls.key
2. 配置TLS终止网关:
apiVersion: gateway.networking.k8s.io/v1
kind: Gateway
metadata:
name: tls-gateway
spec:
gatewayClassName: eg
listeners:
- name: https
protocol: TLS
port: 443
tls:
mode: Terminate
certificateRefs:
- name: example-cert
kind: Secret
四、生产环境运维:监控、升级与故障排查
4.1 监控指标与可视化
Envoy Gateway暴露Prometheus格式指标,默认端口19001:
# prometheus-service-monitor.yaml
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
name: envoy-gateway
spec:
selector:
matchLabels:
app.kubernetes.io/name: envoy-gateway
endpoints:
- port: metrics
interval: 15s
关键指标说明:
| 指标名称 | 描述 | 警戒阈值 |
|---|---|---|
| envoy_gateway_xds_pushes_total | XDS配置推送总数 | 推送失败>0持续5分钟 |
| envoy_gateway_routes_total | 活跃路由数量 | 与预期路由数不符 |
| envoy_proxy_upstream_cx_total | 上游连接总数 | 连接错误率>1% |
4.2 版本升级策略
Helm升级:
helm upgrade eg oci://docker.io/envoyproxy/gateway-helm \
--version v0.0.0-latest \
-n envoy-gateway-system
金丝雀升级:
- 部署新版本Envoy Gateway(使用不同命名空间)
- 创建新GatewayClass指向新版本控制器
- 逐步迁移Gateway资源到新GatewayClass
4.3 常见故障排查流程
flowchart LR
A[流量异常] --> B{检查Gateway状态}
B -->|NotReady| C[查看EG日志: kubectl logs -l app=envoy-gateway]
B -->|Ready| D[检查HTTPRoute事件: kubectl describe httproute <name>]
D --> E{路由是否Accepted}
E -->|No| F[检查匹配规则与后端健康状态]
E -->|Yes| G[检查Envoy配置: egctl proxy config dump <pod-name>]
典型问题解决方案:
- 路由不生效:检查GatewayClass控制器名称是否正确(
gateway.envoyproxy.io/gatewayclass-controller) - 证书加载失败:确认Secret存在且包含
tls.crt和tls.key字段 - 服务不可达:验证后端服务标签选择器与Pod标签匹配
五、总结与进阶学习路径
通过本文学习,你已掌握Envoy Gateway的核心部署与配置能力。作为云原生API网关的新星,Envoy Gateway正在快速迭代,未来将支持更多高级功能如WASM扩展、gRPC路由等。
进阶学习资源:
- 官方文档:深入理解Gateway API规范与扩展机制
- 示例库:探索examples目录下的高级用例(ext-auth、ratelimit等)
- 社区交流:加入Envoy Slack的#envoy-gateway频道
下一步行动:
- 尝试配置高级流量策略(熔断、重试、超时控制)
- 集成外部认证服务(OAuth2/OIDC)
- 实现多集群流量管理
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0198
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0129
MiMo-V2.5-Pro-FP4-DFlashMiMo-V2.5-Pro-FP4-DFlash 是驱动 MiMo-V2.5-Pro-UltraSpeed 的底层模型: FP4 量化骨干网络:对 MoE 专家采用 MXFP4 量化,同时保持模型其他部分的更高精度,在几乎无损质量的前提下,显著减小模型体积并降低内存带宽压力。 BF16 DFlash 草稿生成器:用于块扩散推测解码,每次前向传播可生成一整个块的 tokens,并让骨干网络一步完成验证。 两者协同作用,既降低了每参数的位宽,又减少了骨干网络前向传播的次数,而这两者正是万亿参数模型解码过程中的两大主要成本来源。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
AstrBot✨ 易上手的多平台 LLM 聊天机器人及开发框架 ✨ 平台支持 QQ、QQ频道、Telegram、微信、企微、飞书 | OpenAI、DeepSeek、Gemini、硅基流动、月之暗面、Ollama、OneAPI、Dify 等。附带 WebUI。Python07
handy-ollama动手学Ollama,CPU玩转大模型部署,在线阅读地址:https://datawhalechina.github.io/handy-ollama/Jupyter Notebook07
最新内容推荐
项目优选
收起
暂无描述
Dockerfile
767
5.01 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
866
1.95 K
Ascend Extension for PyTorch
Python
725
897
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
692
1.35 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
458
454
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.09 K
1.12 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.02 K
265
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
152
238
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
1.01 K
629
Oohos_react_native
React Native鸿蒙化仓库
C++
357
425