Skip to content

VAE 图像处理器

[VaeImageProcessor] 提供了一个统一的 API,用于 [StableDiffusionPipeline] 对图像输入进行 VAE 编码,并在解码后对输出进行后处理。这包括诸如调整大小、归一化以及在 PIL 图像、PyTorch 和 NumPy 数组之间转换之类的变换。

所有带有 [VaeImageProcessor] 的管道都接受 PIL 图像、PyTorch 张量或 NumPy 数组作为图像输入,并根据用户提供的 output_type 参数返回输出。你可以将编码后的图像潜变量直接传递给管道,并使用 output_type 参数(例如 output_type="latent")从管道返回潜变量作为特定输出。这使你能够将从一个管道生成的潜变量作为输入传递给另一个管道,而无需离开潜变量空间。它还通过在不同管道之间直接传递 PyTorch 张量,使使用多个管道变得更加容易。

VaeImageProcessor

[[autodoc]] image_processor.VaeImageProcessor

VaeImageProcessorLDM3D

[VaeImageProcessorLDM3D] 接受 RGB 和深度输入,并返回 RGB 和深度输出。

[[autodoc]] image_processor.VaeImageProcessorLDM3D

PixArtImageProcessor

[[autodoc]] image_processor.PixArtImageProcessor

IPAdapterMaskProcessor

[[autodoc]] image_processor.IPAdapterMaskProcessor