dbt-snowflake-utils 项目启动与配置教程

2025-05-08 17:04:46作者：何举烈Damon

1. 项目目录结构及介绍

dbt-snowflake-utils 项目的主要目录结构如下：

dbt-snowflake-utils/
├── macros/                # 存放 dbt 宏文件
│   ├── __init__.py
│   └── snowflake_utilsMacros.py  # 包含 Snowflake 特定的宏
├── models/                # 存放 dbt 模型文件
├── tests/                 # 存放测试文件
│   ├── __init__.py
│   └── test_snowflake_utilsMacros.yml  # 测试宏的 YAML 文件
├── data/                  # 存放数据文件，如 CSV 或 Excel
├── dbt_project.yml        # dbt 项目配置文件
└── README.md              # 项目说明文件

macros/ 目录包含了所有自定义的 dbt 宏，这些宏是用于扩展 dbt 功能的 Python 函数和类。
models/ 目录将包含所有通过 dbt 生成的数据模型。
tests/ 目录包含对项目中的模型和宏进行测试的文件。
data/ 目录用于存放项目所需的数据文件。
dbt_project.yml 是 dbt 的项目配置文件，它定义了项目的元数据和设置。
README.md 文件提供了关于项目的说明。

2. 项目的启动文件介绍

dbt_project.yml 文件是项目的启动文件，它定义了 dbt 项目的基本信息以及一些配置选项。以下是一个示例：

name: 'dbt_snowflake_utils'
version: '1.0.0'

profile: 'snowflake'
source:
  'example': 'raw'
  'snowflake': 'staging'

models:
  'example':
    +materialization: view

seeds:
  'example':
    +schema: 'public'

transforms:
  'example':
    +schema: 'transformed'

这个文件指定了项目的名称和版本，以及使用哪个配置文件（profile）。它还定义了数据源、模型、种子（seeds）和转换（transforms）的配置。

3. 项目的配置文件介绍

配置文件通常位于项目根目录下的 .dbt 文件夹内，例如 dbt-snowflake-utils/.dbt/config.yaml。以下是配置文件的一个示例：

profiles:
  snowflake:
    target: dev
    outputs:
      dev:
        type: snowflake
        account: 'my_account'
        user: 'my_user'
        password: 'my_password'
        role: 'sysadmin'
        database: 'my_database'
        warehouse: 'my_warehouse'
        schema: 'my_schema'

在这个配置文件中，我们定义了一个名为 snowflake 的配置，它包含了连接到 Snowflake 数据库所需的详细信息和项目设置。target 指定了使用的环境，这里是 dev 环境。outputs 下面的配置定义了如何连接到 Snowflake，包括账户、用户名、密码、角色、数据库名、仓库和模式。这些信息用于 dbt 在执行任务时与 Snowflake 数据库建立连接。

登录后查看全文