AsyncDiff: 异步去噪加速扩散模型的实现

2024-09-22 06:52:41作者：昌雅子Ethen

1. 项目介绍

AsyncDiff 是一个通用且即插即用的扩散模型加速方案，它通过在多个设备上实现模型并行性来提高去噪效率。该方案通过将复杂的噪声预测模型分解为多个组件，并将每个组件分配给不同的设备，从而打破组件间的依赖链。利用连续扩散步骤中隐藏状态的高相似性，将传统的顺序去噪转变为异步过程，从而显著减少推理延迟，同时最小化对生成质量的影响。

2. 项目快速启动

在开始之前，请确保您的系统满足以下要求：

NVIDIA GPU + CUDA >= 12.0 和相应的 CuDNN

创建环境

conda create -n asyncdiff python=3.10
conda activate asyncdiff
pip install -r requirements.txt

使用示例

以下是一个使用 Stable Diffusion pipeline 的示例，以启用扩散模型的异步并行推理：

import torch
from diffusers import StableDiffusionPipeline
from asyncdiff.async_sd import AsyncDiff

# 加载预训练的 Stable Diffusion 模型
pipeline = StableDiffusionPipeline.from_pretrained(
    "stabilityai/stable-diffusion-2-1",
    torch_dtype=torch.float16,
    use_safetensors=True,
    low_cpu_mem_usage=True
)

# 初始化 AsyncDiff
async_diff = AsyncDiff(pipeline, model_n=2, stride=1, time_shift=False)
async_diff.reset_state(warm_up=1)

# 生成图像
image = pipeline("<prompts>")[0]

# 如果是分布式训练的第一节点，保存图像
if dist.get_rank() == 0:
    image.save("output.jpg")

您可以替换 pipeline 为其他版本的 Stable Diffusion pipeline，如 SD 2.1、SD 1.5、SDXL 或 SVD。

3. 应用案例和最佳实践

AsyncDiff 支持多种扩散模型的加速推理，以下是一些案例：

加速 Stable Diffusion XL 推理：

CUDA_VISIBLE_DEVICES=0,1,2,3 python -m torch.distributed.run --nproc_per_node=4 --run-path examples/run_sdxl.py

加速 Stable Diffusion 2.1 或 1.5 推理：

CUDA_VISIBLE_DEVICES=0,1,2,3 python -m torch.distributed.run --nproc_per_node=4 --run-path examples/run_sd.py

加速 Stable Diffusion 3 Medium 推理：

CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.run --nproc_per_node=2 --run-path examples/run_sd3.py

更多案例和最佳实践可以在项目的 examples 目录中找到。

4. 典型生态项目

AsyncDiff 的生态项目包括但不限于以下几种：

Stable Diffusion 2.1、1.5、3 Medium、SDXL、SDXL Inpainting
ControlNet、SD Upscaler、AnimateDiff、Stable Video Diffusion

这些项目都可以在 AsyncDiff 的官方仓库中找到相应的脚本和示例。

项目优选

收起

本仓将收集和展示仓颉鸿蒙应用示例代码，欢迎大家投稿，在仓颉鸿蒙社区展现你的妙趣设计！

Cangjie

276

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

Cangjie

200

xzs-mysql

学之思开源考试系统是一款 java + vue 的前后端分离的考试系统。主要优点是开发、部署简单快捷、界面设计友好、代码结构清晰。支持web端和微信小程序，能覆盖到pc机和手机等设备。支持多种部署方式：集成部署、前后端分离部署、docker部署

HTML

LangChat

LangChat: Java LLMs/AI Project, Supports Multi AI Providers( Gitee AI/ 智谱清言 / 阿里通义 / 百度千帆 / DeepSeek / 抖音豆包 / 零一万物 / 讯飞星火 / OpenAI / Gemini / Ollama / Azure / Claude 等大模型), Java生态下AI大模型产品解决方案，快速构建企业级AI知识库、AI机器人应用

Java

gin-vue-admin

🚀Vite+Vue3+Gin的开发基础平台，支持TS和JS混用。它集成了JWT鉴权、权限管理、动态路由、显隐可控组件、分页封装、多点登录拦截、资源权限、上传下载、代码生成器【可AI辅助】、表单生成器和可配置的导入导出等开发必备功能。

source-vue

🔥 一直想做一款追求极致用户体验的快速开发平台，看了很多优秀的开源项目但是发现没有合适的。于是利用空闲休息时间对若依框架进行扩展写了一套快速开发系统。如此有了开源字节快速开发平台。该平台基于 Spring Boot + MyBatis + Vue & Element ，包含微信小程序 & Uniapp， Web 报表、可视化大屏、三方登录、支付、短信、邮件、OSS...

Java

CangjieCommunity

为仓颉编程语言开发者打造活跃、开放、高质量的社区环境

🔥 cool-admin(java版)一个很酷的后台权限管理框架，Ai编码、流程编排、模块化、插件化、CRUD极速开发，永久开源免费，基于springboot3、typescript、vue3、vite、element-ui等构建

Java

AsyncDiff: 异步去噪加速扩散模型的实现

1. 项目介绍

2. 项目快速启动

创建环境

使用示例

3. 应用案例和最佳实践

4. 典型生态项目

热门内容推荐

最新内容推荐

项目优选

AsyncDiff: 异步去噪加速扩散模型的实现

1. 项目介绍

2. 项目快速启动

创建环境

使用示例

3. 应用案例和最佳实践

4. 典型生态项目

相关内容推荐

热门内容推荐

最新内容推荐

项目优选