Apache Druid扩展开发:解决SQL聚合函数测试中的ComponentSupplier配置问题
2025-05-17 01:17:01作者:秋泉律Samson
背景介绍
在Apache Druid扩展开发过程中,为系统添加自定义SQL聚合函数是一个常见需求。开发者通常需要编写单元测试来验证这些自定义函数的正确性。然而,近期在Druid 32版本之后,原有的测试框架API发生了重大变化,导致许多基于旧版本编写的测试用例无法正常运行。
问题现象
开发者在实现自定义聚合函数测试时遇到了一个典型错误:"Cannot read field 'componentSupplier' because 'config' is null"。这个错误发生在尝试使用@ComponentSupplier注解配置测试环境时,表明测试框架未能正确初始化Guice依赖注入配置。
技术分析
组件供应机制
Apache Druid的测试框架使用Guice进行依赖注入管理。@ComponentSupplier注解原本用于指定测试类使用的组件供应器,但在框架升级后,其工作方式发生了变化。核心问题在于:
- 测试框架期望通过JUnit 5扩展机制自动初始化配置
- 当测试类使用JUnit 4的
@Test注解时,初始化流程会被跳过 - 导致
SqlTestFrameworkConfig无法正确建立组件供应器映射
框架演进
从Druid 32版本开始:
- 移除了原有的
configureGuice方法 - 改为基于注解的自动配置方式
- 强化了与JUnit 5的集成
解决方案
临时解决方案
通过手动初始化配置可以临时解决问题:
private static void initializeGuiceConfiguration() {
List<Annotation> annotations = List.of(TestClass.class.getAnnotations());
queryFrameworkRule.setConfig(new SqlTestFrameworkConfig(annotations));
}
这种方法虽然有效,但违背了框架设计的初衷,不是最佳实践。
推荐方案
正确的做法是:
- 确保使用JUnit 5的测试注解(
org.junit.jupiter.api.Test) - 完整实现组件供应器类
- 正确配置测试类注解
示例组件供应器实现:
public class CustomComponentSupplier extends SqlTestFramework.StandardComponentSupplier {
public CustomComponentSupplier(TempDirProducer tempDirProducer) {
super(tempDirProducer);
}
@Override
public DruidModule getCoreModule() {
return DruidModuleCollection.of(
super.getCoreModule(),
new CustomExtensionModule()
);
}
}
最佳实践
- 版本适配:针对Druid 32+版本,应使用新的测试框架API
- 注解规范:统一使用JUnit 5的测试注解
- 模块管理:在组件供应器中明确声明所有需要的模块
- 环境隔离:确保每个测试类有独立的配置环境
总结
Apache Druid测试框架的演进带来了更现代的编程模型,但也需要开发者适应新的API使用方式。理解Guice在测试环境中的工作机理,以及JUnit 5扩展点的加载时机,对于编写可靠的扩展测试至关重要。当遇到配置问题时,检查注解版本和初始化流程往往是解决问题的关键。
对于正在迁移旧测试代码的开发者,建议全面升级到JUnit 5,并参考最新的官方示例代码,这能避免许多潜在的兼容性问题,也能更好地利用框架提供的新特性。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0190
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0113
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
omega-aiOmega-AI:基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多线程与GPU运算,GPU支持CUDA,CUDNN。Java04
llm-universe本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/Jupyter Notebook08
项目优选
收起
deepin linux kernel
C
32
16
暂无描述
Dockerfile
762
4.95 K
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.8 K
190
Fflutter_flutter
暂无简介
Dart
1 K
260
Ascend Extension for PyTorch
Python
717
869
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
854
1.91 K
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.07 K
1.09 K
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.73 K
1.02 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
676
1.32 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
455
438