dbt-core中测试资源类型选择器的行为差异分析

2025-05-22 00:44:03作者：廉皓灿Ida

dbt-labs/dbt-core: 是一个基于 Python 语言的数据建模和转换工具，可以方便地实现数据仓库的建模和转换等功能。该项目提供了一个简单易用的数据建模和转换工具，可以方便地实现数据仓库的建模和转换等功能，同时支持多种数据仓库和编程语言。

项目地址：https://gitcode.com/GitHub_Trending/db/dbt-core

问题背景

在dbt-core项目中，测试功能分为两种主要类型：传统的数据测试(data tests)和新增的单元测试(unit tests)。这两种测试类型虽然都用于验证数据质量，但在实现机制和使用场景上存在明显差异。然而，在使用资源类型选择器(resource-type selector)时，开发者发现了一个不一致的行为模式。

当前行为表现

通过实际测试可以观察到以下现象：

使用--resource-type unit_test参数时，能够正确且仅返回所有单元测试资源
使用--resource-type test参数时，不仅返回了预期的数据测试，还意外包含了单元测试资源
在dbt build命令中使用--resource-type test时同样会执行两种类型的测试

这种重叠现象会导致开发者在只想运行数据测试时，无意中执行了单元测试，可能带来不必要的执行时间和资源消耗。

技术实现分析

从架构设计角度看，数据测试和单元测试在dbt-core中属于不同的资源类型：

数据测试(data tests)通常是通过YAML文件中的tests属性定义，或者放在tests/目录下的SQL文件
单元测试(unit tests)则是通过YAML文件中的unit_tests部分定义，专门用于测试模型在特定输入下的预期输出

理想情况下，这两种测试应该通过不同的资源类型选择器完全隔离。当前的行为可能是由于在资源类型分类时，单元测试被错误地标记为同时属于test和unit_test两种类型。

影响范围

这一行为差异会影响以下常见工作场景：

只想运行数据测试来验证数据质量时，会意外执行单元测试
资源统计时，--resource-type test会返回比预期更多的结果
在CI/CD流程中，如果依赖资源类型选择器来隔离测试类型，可能导致不必要的测试执行

解决方案建议

从设计一致性和用户体验角度，建议的修复方案应包括：

使--resource-type test仅匹配传统数据测试
保持--resource-type unit_test仅匹配单元测试
当需要同时运行两种测试时，明确使用--resource-type test unit_test

这种设计更符合最小惊讶原则，也与dbt-core中其他资源类型选择器的工作方式保持一致。

临时解决方案

在官方修复发布前，开发者可以采用以下临时方案：

对于只想运行数据测试的场景，使用dbt test --exclude resource_type:unit_test
在统计资源时，通过管道和grep等工具过滤掉unit_test结果
在CI/CD脚本中明确区分两种测试的执行命令

总结

资源类型选择器是dbt-core中强大的功能之一，保持其行为的一致性和可预测性对开发者体验至关重要。当前测试资源类型选择器的重叠现象虽然不会导致功能错误，但可能引起混淆和意外行为。建议开发者在相关修复发布前注意这一差异，并在工作流程中采取相应的应对措施。

dbt-labs/dbt-core: 是一个基于 Python 语言的数据建模和转换工具，可以方便地实现数据仓库的建模和转换等功能。该项目提供了一个简单易用的数据建模和转换工具，可以方便地实现数据仓库的建模和转换等功能，同时支持多种数据仓库和编程语言。

项目地址：https://gitcode.com/GitHub_Trending/db/dbt-core

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统