Self-Forcing 的项目扩展与二次开发

2025-06-11 07:59:58作者：咎岭娴Homer

Self-Forcing

项目地址：https://gitcode.com/gh_mirrors/se/Self-Forcing

项目的基础介绍

Self-Forcing 是一个旨在解决自动回归视频扩散模型训练与测试分布不匹配问题的开源项目。该项目通过在训练过程中模拟推理过程，使用键值（KV）缓存进行自动回归滚动，从而实现实时的流视频生成，同时保持与最先进的扩散模型相匹配的质量。

项目的核心功能

训练推理对齐：通过在训练时模拟推理过程，减少了训练与测试间的分布差异。
实时视频生成：支持在单个 RTX 4090 显卡上实现实时视频流生成。
性能与质量并重：生成的视频质量与现有最先进的扩散模型相当。

项目使用了哪些框架或库？

Python：项目的主要编程语言。
PyTorch：深度学习框架，用于模型的定义和训练。
HuggingFace：用于下载和管理预训练模型和检查点。

项目的代码目录及介绍

Self-Forcing/
├── configs/              # 配置文件目录
├── demo_utils/           # 示例脚本工具
├── model/                # 模型定义
├── pipeline/             # 数据处理流水线
├── prompts/              # 提示语文件
├── scripts/              # 脚本目录
├── templates/            # 模板文件
├── trainer/              # 训练器模块
├── utils/                # 实用工具模块
├── wan/                  # 可能的额外模块或子项目
├── LICENSE.md            # 许可证文件
├── README.md             # 项目说明文件
├── demo.py               # 示例运行脚本
├── inference.py          # 推理脚本
├── requirements.txt      # 项目依赖
├── setup.py              # 项目设置脚本
└── train.py              # 训练脚本