Dbt Mcp 项目启动与配置教程

2025-04-24 00:24:50作者：虞亚竹Luna

1. 项目目录结构及介绍

Dbt Mcp 项目的目录结构如下：

dbt-mcp/
├── dbt_project.yml       # Dbt 项目配置文件
├── macros/               # 自定义宏和操作定义的目录
│   ├── __init__.py
│   └── custom_macros.sql # 自定义宏文件
├── models/               # 模型定义的目录
│   ├── __init__.py
│   └── ...               # 具体的模型文件
├── tests/                # 测试定义的目录
│   ├── __init__.py
│   └── ...               # 具体的测试文件
├── data/                 # 存储原始数据文件的目录
├── seeds/                # 种子文件，用于加载数据到数据库的初始状态
│   ├── __init__.py
│   └── ...               # 具体的种子文件
├── snapshots/            # 快照文件，用于在dbt中创建数据库的快照
│   ├── __init__.py
│   └── ...               # 具体的快照文件
└── target/               # dbt 生成的文件和数据库的输出目录

每个目录和文件的作用如下：

dbt_project.yml：定义了项目的配置信息，如数据源连接、模型和测试的设置等。
macros/：包含了自定义的宏和操作，可以在项目中重复使用。
models/：包含了所有的模型定义，这些模型是dbt用来转换数据的逻辑定义。
tests/：包含了所有的测试定义，用于验证模型生成数据的正确性。
data/：存储原始数据文件，通常在数据准备阶段使用。
seeds/：包含了用于初始化数据库状态的种子文件。
snapshots/：包含了快照文件，用于记录数据库的快照状态。
target/：是dbt运行时生成的文件和数据库的输出目录。

2. 项目的启动文件介绍

在Dbt Mcp项目中，启动文件主要是dbt_project.yml。该文件定义了项目的基本配置，包括项目名称、数据源连接信息以及其他dbt运行时所需的配置项。

以下是一个简化的dbt_project.yml文件示例：

name: 'my_dbt_project'
version: '1.0'

source:
  'my_source':
    tables: ['my_table']

models:
  my_model:
    source: 'my_source'
    name: 'my_table'

在这个配置文件中，定义了以下内容：

name：项目的名称。
version：项目的版本号。
source：数据源配置，定义了数据源名称和包含的表。
models：模型配置，定义了从哪个数据源和表中获取数据，并如何命名。

3. 项目的配置文件介绍

项目的配置文件同样是dbt_project.yml。在这个文件中，除了定义项目的基本信息外，还可以配置数据库连接信息、变量、插件设置等。

以下是一个dbt_project.yml文件中的配置示例：

name: 'my_dbt_project'
version: '1.0'

profile: 'my_profile'

models:
  my_model:
    source: 'my_source'
    name: 'my_table'

seeds:
  my_seed:
    name: 'my_table_seed'

snapshots:
  my_snapshot:
    source: 'my_source'
    name: 'my_table_snapshot'

variables:
  my_variable: 'my_value'