Astronomer-Cosmos 1.9.0版本解析：性能优化与异步执行新特性

2025-07-08 10:55:08作者：侯霆垣

项目概述

Astronomer-Cosmos是一个开源项目，它作为Apache Airflow与dbt（data build tool）之间的桥梁，帮助数据工程师在Airflow中更好地管理和执行dbt项目。该项目简化了将dbt模型集成到Airflow工作流中的过程，提供了多种加载和运行模式，使得数据转换工作流更加灵活和高效。

核心更新解析

1. 性能优化：dbtRunner替代子进程

在1.9.0版本中，当使用LoadMode.DBT_LS模式时，Cosmos现在会尝试使用dbtRunner而非子进程来运行dbt ls命令。这一改变带来了显著的性能提升：

减少了约50%的vCPU使用率
降低了内存消耗
提高了整体执行效率

对于多Python虚拟环境管理不同dbt版本的用户，可以通过设置RenderConfig(invocation_mode=InvocationMode.SUBPROCESS)来保持与之前版本相同的行为。

2. 异步执行增强

1.9.0版本对异步执行模式(ExecutionMode.AIRFLOW_ASYNC)进行了多项改进：

精确SQL语句生成：现在能够创建和运行更准确的SQL语句
多数据库支持：为异步操作执行添加了多数据库支持结构
任务生命周期管理：新增了setup和teardown任务，完善了异步执行的生命周期
虚拟环境支持：扩展了Virtualenv操作符，并为setup和teardown任务模拟dbt适配器

3. 配置灵活性提升

节点级profile配置：现在支持在每个dbt节点或文件夹级别覆盖profile_config
依赖安装控制：新增ProjectConfig.install_dbt_deps参数，并将operator的install_deps默认值设为True
AWS ECS任务运行：新增了AWS ECS任务运行执行模式

重要问题修复

复杂标签选择器修复：修复了三个基于标签的图形选择器的复杂交集选择问题
模型名称处理：修复了模型名称包含句点时的自定义选择器行为
参数过滤：正确过滤异步操作符的dbt和非dbt关键字参数

开发者体验改进

代码结构优化：将DbtRunner相关函数移动到dbt/runner.py模块中
警告处理：修复了OpenLineage的弃用警告
回调统一：为DbtSourceKubernetesOperator添加on_warning_callback并重构之前的操作符
错误处理增强：当用户设置不兼容的RenderConfig.dbt_deps和operator_args install_deps时，提供更优雅的错误处理