MAGI-1 开源项目教程

2026-01-31 05:15:57作者：江焘钦

1. 项目目录结构及介绍

MAGI-1 项目是一个用于视频生成的开源项目，其目录结构如下：

MAGI-1/
├── codestyle/
├── example/
│   ├── 24B/
│   ├── 4.5B/
│   └── assets/
├── figures/
├── inference/
├── .gitignore
├── .pre-commit-config.yaml
├── LICENSE
├── README.md
├── requirements.txt
└── ...

codestyle/: 包含代码风格配置文件。
example/: 包含示例脚本和资产文件。
- 24B/ 和 4.5B/: 分别包含不同规模模型运行的示例脚本。
- assets/: 存放示例图片和视频文件。
figures/: 存放项目相关的图像文件，如模型架构图等。
inference/: 包含推理代码。
.gitignore: 指定 Git 忽略的文件和目录。
.pre-commit-config.yaml: 包含 pre-commit 钩子配置。
LICENSE: 项目许可证文件。
README.md: 项目说明文件。
requirements.txt: 项目依赖的 Python 包列表。

2. 项目的启动文件介绍

项目的启动文件位于 example/24B/run.sh 和 example/4.5B/run.sh。以下是 run.sh 脚本的主要内容：

#!/bin/bash

# 运行 24B MAGI-1 模型
bash example/24B/run.sh

# 运行 4.5B MAGI-1 模型
bash example/4.5B/run.sh

启动文件负责运行 MAGI-1 模型，可以通过修改脚本中的参数来控制输入和输出。

3. 项目的配置文件介绍

项目的配置文件通常为 config.json，位于示例目录下。以下是配置文件的一个示例：

{
  "seed": 42,
  "video_size_h": 256,
  "video_size_w": 256,
  "num_frames": 48,
  "fps": 8,
  "cfg_number": 2,
  "load": "path/to/checkpoint",
  "t5_pretrained": "path/to/t5/pretrained/model"
}

seed: 视频生成时使用的随机种子。
video_size_h 和 video_size_w: 视频的高度和宽度。
num_frames: 控制生成视频的时长。
fps: 视频的帧率，每 4 帧视频对应 1 个潜在帧。
cfg_number: 模型使用的配置编号。
load: 模型检查点的路径。
t5_pretrained: 预训练的 T5 模型路径。