ComfyUI-LTXVideo视频分辨率设置：平衡质量与性能

2026-02-05 05:25:35作者：廉皓灿Ida

在视频生成过程中，分辨率设置是影响最终效果的关键因素。过高的分辨率可能导致显存溢出和生成速度缓慢，而过低的分辨率则会损失画面细节。本文将详细介绍如何在ComfyUI-LTXVideo中合理配置视频分辨率，通过官方工具和工作流实现质量与性能的最佳平衡。

分辨率设置基础

ComfyUI-LTXVideo的默认工作流采用"基础分辨率生成+后期 upscale"的两步策略。以Image to video base工作流为例，其核心配置为：

基础生成分辨率：768×512像素
后期 upscale 目标：1920×1080像素（FHD）

这种设计既保证了生成效率，又通过Latent Upsampler模块实现了细节增强。工作流中明确标注："We generate at a base resolution of 768x512. The video will be upscaled later to FHD."

核心分辨率控制工具

1. 潜在空间 upscale 技术

latent_upsampler.py实现了不经过像素空间直接对潜在张量进行放大的功能，支持空间和时间维度的独立控制：

空间 upscale：通过PixelShuffle2D将分辨率提升2倍
时间 upscale：通过PixelShuffle1D增加视频帧数
3D upscale：同时提升空间分辨率和帧率

该模块在Video Upscaling工作流中得到应用，配合专用模型实现高效放大：

# 空间 upscale 核心实现
self.upsampler = nn.Sequential(
    nn.Conv2d(mid_channels, 4 * mid_channels, kernel_size=3, padding=1),
    PixelShuffle2D(2),  # 将H×W分辨率提升2倍
)

2. VAE性能优化工具

vae_patcher/vae_patcher.py通过内存优化技术降低高分辨率解码时的显存占用，最高可减少50%内存消耗：

# 内存计算优化
vae.memory_used_decode = (
    lambda shape, dtype: shape[1] * shape[2] * shape[3] * shape[4] 
    * 8 * 8 * 8 * 3 * dtype_size(dtype)
)

该工具特别适用于消费级GPU处理4K分辨率视频，通过分块解码（patch_block=4）避免显存峰值溢出。

实用工作流配置

1. 标准高清生成流程

推荐使用ltxv-13b-upscale.json工作流，其分辨率转换链条为：

基础生成：768×512（ latent 空间）
潜在 upscale：1536×1024（使用ltxv-spatial-upscaler模型）
最终输出：1920×1080（VAE解码后微调）

2. 多尺度混合生成

Image to video mixed工作流展示了更灵活的分辨率控制策略，通过动态调整STG参数平衡不同尺度的细节表现：

"stg_scale_values": [0, 4, 4, 4, 2, 1],
"stg_rescale_values": [1, 0.5, 0.5, 1, 1, 1]

这些参数在stg_advanced_presets.json中预设，对应不同扩散阶段的尺度因子。

性能优化实践

显存占用估算公式

VAE解码时的显存消耗可通过以下公式估算：

显存(MB) = (通道数 × 帧数 × 高度 × 宽度 × 数据类型大小) / 1024²

以FP16格式的10秒视频（300帧，1920×1080，4通道）为例：

4 × 300 × 1080 × 1920 × 2 / 1024² ≈ 4777 MB

分辨率调整建议

设备类型	推荐基础分辨率	推荐 upscale 策略	参考工作流
8GB显存GPU	512×384	2×空间 upscale	ltxv-13b-dist-i2v-base-fp8.json
12GB显存GPU	768×512	2×空间+时间 upscale	ltxv-13b-v2v-long-depth.json
24GB+显存GPU	1024×768	直接生成+细节增强	ltxv-13b-i2v-mixed-multiscale.json