Langfuse项目从Docker迁移到Kubernetes的技术实践

2025-05-22 18:28:21作者：蔡怀权

🪢 Open source AI engineering platform: LLM evals, observability, metrics, prompt management, playground, datasets. Integrates with OpenTelemetry, LangChain, OpenAI SDK, LiteLLM, and more. 🍊YC W23

项目地址：https://gitcode.com/GitHub_Trending/la/langfuse

背景介绍

Langfuse作为一个开源项目，在版本迭代过程中经历了从v2到v3的架构升级。本次技术实践主要探讨如何将Langfuse从基于Docker的v2版本平滑迁移到基于Kubernetes的v3版本环境。

架构变化分析

Langfuse v3版本引入了多项重要的架构改进：

存储组件扩展：新增了ClickHouse作为分析型数据库，Redis用于缓存，以及S3/Blob存储用于事件数据
服务分离：将核心功能拆分为web服务和worker服务，后者专门处理异步事件
数据流优化：API端点改为异步处理模式，提高了系统吞吐量

迁移准备工作

基础设施准备

在Kubernetes集群中需要预先部署以下组件：

ClickHouse集群：用于存储和分析事件数据
Redis实例：作为缓存层
对象存储服务：如MinIO或兼容S3的服务，用于存储事件数据
原有PostgreSQL数据库：可以继续使用v2版本的数据存储

环境变量配置

迁移过程中需要特别注意以下关键环境变量的配置：

CLICKHOUSE_URL=clickhouse://clickhouse-service:8123
CLICKHOUSE_USER=username
CLICKHOUSE_PASSWORD=password
REDIS_CONNECTION_STRING=redis://redis-service:6379
LANGFUSE_S3_EVENT_UPLOAD_BUCKET=langfuse-events

详细迁移步骤

1. 部署新版本服务

在Kubernetes中部署Langfuse v3需要创建以下资源：

Web服务Deployment：处理API请求和前端界面
Worker服务Deployment：负责后台任务处理
相应的Service和Ingress资源：暴露服务访问入口

2. 数据迁移策略

Langfuse v3设计了自动化的数据迁移机制：

系统启动后会运行后台任务，将PostgreSQL中的历史数据逐步迁移到ClickHouse
迁移过程中，新数据会直接写入ClickHouse
系统会自动处理数据一致性问题

3. 流量切换方案

建议采用蓝绿部署策略进行流量切换：

先部署v3版本并完成基本验证
通过修改Ingress规则逐步将流量从v2切换到v3
监控系统运行状态，确保数据完整性

客户端适配建议

由于架构变更，客户端需要做以下适配：

升级SDK到2.0.0及以上版本
处理API响应变化：部分端点改为异步模式
调整错误处理逻辑，适应新的响应格式

迁移后验证

完成迁移后需要进行全面验证：

数据完整性检查：确认历史数据完整迁移
功能测试：验证所有核心功能正常
性能测试：确保新架构满足性能要求
监控告警：设置完善的监控体系

常见问题处理

在实际迁移过程中可能会遇到：

数据迁移速度慢：可以调整worker资源配置
部分数据暂时不可见：属于正常现象，等待后台迁移完成
API响应延迟：检查异步任务处理情况

总结

Langfuse从v2到v3的迁移不仅是简单的版本升级，更是一次架构演进。通过合理的规划和执行，可以充分利用新版本的优势，获得更好的性能和扩展性。建议在正式迁移前搭建测试环境充分验证，并制定详细的回滚方案以应对可能的风险。

langfuse

项目地址：https://gitcode.com/GitHub_Trending/la/langfuse

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

pytorch

Ascend Extension for PyTorch

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

465

456

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

458

5.25 K