ComfyUI对Nvidia Cosmos视频生成模型的支持进展

2025-04-30 02:10:08作者：伍希望

The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.

项目地址：https://gitcode.com/GitHub_Trending/co/ComfyUI

ComfyUI作为一款流行的AI图像生成工具，近期在其开发分支中增加了对Nvidia Cosmos系列视频生成模型的支持。这一进展为ComfyUI用户带来了全新的视频生成能力。

Cosmos模型概述

Nvidia Cosmos是一系列基于扩散模型的视频生成AI，能够根据文本提示生成高质量的视频内容。该系列模型采用了先进的视频生成架构，在保持时间连贯性的同时，能够生成细节丰富的视频画面。

ComfyUI的集成情况

目前ComfyUI的开发版本已经初步支持Cosmos 1.0文本到视频(text2video)模型。开发团队提供了以下关键组件：

模型权重文件：已转换为Safetensors格式的模型文件
文本编码器和VAE组件：专门适配ComfyUI的版本

技术实现细节

ComfyUI通过以下方式实现了对Cosmos模型的支持：

修改了模型加载逻辑，适配Cosmos特有的网络结构
实现了视频帧序列的处理管线
优化了内存使用，使模型能够在消费级GPU上运行

当前局限性与未来展望

虽然基础功能已经实现，但目前仍存在一些限制：

尚未支持Cosmos-1.0-Autoregressive模型变体
对低显存设备的优化不足
缺少对量化模型(GGUF格式)的支持

未来开发方向可能包括：

增加对更多Cosmos模型变体的支持
优化显存使用，使模型能在8-12GB显存的GPU上运行
开发更完善的视频后处理功能

使用建议

对于想要尝试Cosmos模型的ComfyUI用户，建议：

使用16GB或更大显存的GPU
关注官方文档中的示例工作流
预留足够的生成时间(目前约25-30分钟/视频)

随着开发的持续推进，ComfyUI对Cosmos模型的支持将更加完善，为用户带来更强大的AI视频创作体验。

The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.

项目地址：https://gitcode.com/GitHub_Trending/co/ComfyUI

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。