dbt-duckdb 1.9.2版本发布：增强外部存储支持与测试稳定性

2025-07-05 19:23:32作者：尤峻淳Whitney

dbt-duckdb是一个将dbt（数据构建工具）与DuckDB数据库引擎集成的开源项目。它允许数据分析师和工程师使用dbt的强大功能来转换和建模数据，同时利用DuckDB的高性能OLAP处理能力。这个项目特别适合需要在本地或嵌入式环境中进行数据分析的场景。

主要更新内容

默认保持连接开启

在这个版本中，keep_open: true成为了默认设置。这意味着dbt-duckdb现在会保持与DuckDB数据库的连接处于开启状态，而不是在每个操作后关闭连接。这一改变显著提高了性能，特别是在需要频繁执行多个操作的工作流中。对于需要关闭连接的特殊情况，用户仍然可以通过配置显式设置keep_open: false。

外部存储增强

空表处理修复：修复了当外部存储（如S3）中的表为空时无法正常工作的问题。现在，无论表中是否有数据，外部存储功能都能可靠地工作。
多线程输出支持：新增了对per_thread_output参数的支持，允许在外部物化过程中为每个线程指定独立的输出位置。这对于并行处理大量数据特别有用，可以避免输出冲突并提高性能。

测试与稳定性改进

临时目录处理优化：改进了测试中临时目录的处理方式，使用tmpdir_factory替代tmp_path_factory，提高了文件相关测试的稳定性。
每日DuckDB夜间构建测试：现在项目会每天自动运行测试，使用DuckDB的最新夜间构建版本。这有助于及早发现与DuckDB最新版本的兼容性问题。
S3测试条件优化：当缺少必要的S3凭证时，相关测试会被自动跳过，而不是失败，这使得在没有配置S3环境的开发机器上也能顺利运行测试套件。

开发环境与依赖更新

Python版本支持调整：
- 移除了对Python 3.8的支持
- 新增了对Python 3.12的支持
- 现在支持的Python版本为3.9-3.12
依赖项升级：
- mypy从1.13.0升级到1.15.0
- dbt-tests-adapter从1.10.4升级到1.11.0
CI/CD流程简化：移除了不必要的包构建和测试构建步骤，使开发流程更加高效。