TensorZero项目多版本ClickHouse兼容性测试实践

2025-06-18 09:34:13作者：昌雅子Ethen

背景介绍

TensorZero作为一个开源机器学习平台，其核心功能依赖于ClickHouse数据库作为后端存储和查询引擎。近期项目团队发现，在ClickHouse的某个版本更新后，TensorZero的用户界面查询功能出现了兼容性问题。这一事件促使团队开始重视对多版本ClickHouse的兼容性测试工作。

问题分析

在2025年2月发布的ClickHouse版本中，引入了一个影响TensorZero UI查询功能的bug。这个bug导致原本正常工作的查询语句在新版本中出现异常。经过与ClickHouse团队的沟通确认，这确实是一个ClickHouse自身的问题。

解决方案

为了提前发现和预防类似的兼容性问题，TensorZero团队决定建立全面的ClickHouse版本测试矩阵。这套测试方案覆盖了以下几个关键方面：

版本覆盖策略：
- 最新稳定版(latest)
- 长期支持版(lts)
- 2024年1月以来的所有月度小版本
- ClickHouse云服务版本
测试内容设计：
- 数据库迁移脚本验证
- 核心网关功能测试（包括模拟推理和反馈功能）
- 用户界面单元测试
实施细节：
- 使用自动化测试框架构建测试矩阵
- 对每个测试版本独立运行完整测试流程
- 建立版本兼容性基线

技术实现

团队通过两个主要Pull Request实现了这一测试体系：

基础多版本测试框架：构建了能够在不同ClickHouse版本上运行UI测试的基础设施，确保核心功能在各种环境下都能正常工作。
ClickHouse云服务集成：特别针对云服务版本设计了测试方案，考虑到云环境与自建环境的差异，确保TensorZero在两种部署模式下都能稳定运行。

最佳实践

基于这次经验，我们总结出以下数据库兼容性测试的最佳实践：

版本覆盖：不仅要测试最新版本，还要覆盖长期支持版和历史版本，确保升级路径平滑。
测试粒度：区分不同层次的测试，从底层的数据库迁移到上层的业务功能都需要验证。
云服务考量：云服务版本可能有特殊行为，需要单独测试。
自动化程度：建立自动化的测试矩阵，及时发现兼容性问题。

未来展望

随着TensorZero项目的持续发展，数据库兼容性测试将作为持续集成流程的重要组成部分。团队计划进一步扩展测试范围，包括：

增加性能基准测试
覆盖更多边缘场景
建立版本升级指南
开发自动修复工具

通过这套完善的测试体系，TensorZero能够为用户提供更加稳定可靠的服务，同时也为开源社区贡献了数据库兼容性测试的实践案例。

tensorzero

TensorZero creates a feedback loop for optimizing LLM applications — turning production data into smarter, faster, and cheaper models.

项目地址：https://gitcode.com/GitHub_Trending/te/tensorzero

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

C++

161

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

124

161