Astronomer Cosmos 1.10.0a2版本深度解析：Airflow 3支持与DBT增强

2025-07-08 00:33:52作者：蔡丛锟

项目背景

Astronomer Cosmos是一个强大的开源工具，它作为Apache Airflow和dbt之间的桥梁，帮助数据工程师将dbt项目无缝集成到Airflow工作流中。通过Cosmos，用户可以在Airflow中调度和执行dbt模型、测试和文档生成等任务，实现数据转换管道的编排和管理。

核心更新内容

1. Airflow 3全面支持

1.10.0a2版本最重要的特性是增加了对Airflow 3的全面支持，这包括：

DbtDag渲染兼容性：确保在Airflow 3环境下能够正确渲染dbt DAG
Rendered Task Instance Fields处理重构：针对Airflow 2.x和3.x的不同版本进行了适配
变量系统兼容：修复了Airflow 3中变量查找的问题
调度参数标准化：使用新的schedule参数替代已弃用的schedule_interval
虚拟环境路径处理：确保virtualenv_dir路径存在性检查

2. dbt功能增强

增量依赖管理：新增支持增量运行dbt deps到预定义的dbt_packages目录
DuckDB适配器支持：增加了DuckDB profile映射，扩展了支持的数据库类型
测试选择器改进：修复了test_indirect_selection标志在TestBehavior.BUILD情况下的传播问题
分离测试处理：优化了分离测试情况下的select子句处理

3. 执行环境优化

Kubernetes警告回调：重构了Kubernetes执行模式下的警告回调处理
多回调支持：现在允许为任务配置多个回调函数
虚拟环境可靠性：增强了虚拟环境准备阶段的健壮性

技术实现细节

Airflow 3适配策略

开发团队采用了渐进式适配策略，通过版本检测和条件导入确保代码在Airflow 2.x和3.x上都能正常工作。特别值得注意的是：

RTIF处理：重新设计了渲染任务实例字段的处理逻辑，使用兼容层平滑过渡
插件系统：在Airflow 3中暂时禁用了CosmosPlugin，等待更稳定的插件API
依赖管理：针对dbt适配器与pydantic 2.11+的兼容性问题进行了特殊处理

dbt增量依赖管理

新引入的增量依赖管理功能通过以下方式优化性能：

首次运行时完整下载所有依赖到dbt_packages目录
后续运行仅检查并更新有变化的依赖
支持通过配置控制是否强制重新下载所有依赖

开发者工具改进

为支持Airflow 3开发，项目增加了多项开发者工具：

Airflow 3专用开发环境：简化了针对不同Airflow版本的测试和开发
CI测试矩阵扩展：在持续集成中增加了Airflow 3的测试组合
类型检查强化：修复了多个类型注解问题，提高代码质量

实际应用建议

对于计划升级的用户，建议：

测试环境先行：在非生产环境充分验证Airflow 3兼容性
依赖管理：注意dbt适配器版本与pydantic的兼容性要求
回调函数检查：如果使用自定义回调，确保其兼容多回调机制
Kubernetes执行：验证Kubernetes执行模式下的警告处理是否符合预期

未来展望

1.10.0a2作为预发布版本，标志着Astronomer Cosmos向Airflow 3生态迈出了重要一步。随着Airflow 3的稳定发布，预计将有更多优化和新特性加入，包括但不限于：

更深入的Airflow 3插件系统集成
增强的dbt项目分析和可视化功能
更灵活的执行策略配置

这个版本为数据工程团队提供了平稳过渡到Airflow 3的技术基础，同时继续强化了dbt集成的核心能力，是现代化数据工作流管理的重要里程碑。

astronomer-cosmos

Run your dbt Core projects as Apache Airflow DAGs and Task Groups with a few lines of code

项目地址：https://gitcode.com/gh_mirrors/as/astronomer-cosmos

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

350

203

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理