Skip to content

AutoencoderKLCogVideoX

CogVideoX中使用的带有KL损失的3D变分自编码器(VAE)模型,由清华大学和智谱AI在CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer中介绍。

可以使用以下代码片段加载该模型。

python
from diffusers import AutoencoderKLCogVideoX

vae = AutoencoderKLCogVideoX.from_pretrained("THUDM/CogVideoX-2b", subfolder="vae", torch_dtype=torch.float16).to("cuda")

AutoencoderKLCogVideoX

[[autodoc]] AutoencoderKLCogVideoX - decode - encode - all

AutoencoderKLOutput

[[autodoc]] models.autoencoders.autoencoder_kl.AutoencoderKLOutput

DecoderOutput

[[autodoc]] models.autoencoders.vae.DecoderOutput