算力平台:
VAE 图像处理器
[VaeImageProcessor
] 提供了一个统一的 API,用于 [StableDiffusionPipeline
] 对图像输入进行 VAE 编码,并在解码后对输出进行后处理。这包括诸如调整大小、归一化以及在 PIL 图像、PyTorch 和 NumPy 数组之间转换之类的变换。
所有带有 [VaeImageProcessor
] 的管道都接受 PIL 图像、PyTorch 张量或 NumPy 数组作为图像输入,并根据用户提供的 output_type
参数返回输出。你可以将编码后的图像潜变量直接传递给管道,并使用 output_type
参数(例如 output_type="latent"
)从管道返回潜变量作为特定输出。这使你能够将从一个管道生成的潜变量作为输入传递给另一个管道,而无需离开潜变量空间。它还通过在不同管道之间直接传递 PyTorch 张量,使使用多个管道变得更加容易。
VaeImageProcessor
[[autodoc]] image_processor.VaeImageProcessor
VaeImageProcessorLDM3D
[VaeImageProcessorLDM3D
] 接受 RGB 和深度输入,并返回 RGB 和深度输出。
[[autodoc]] image_processor.VaeImageProcessorLDM3D
PixArtImageProcessor
[[autodoc]] image_processor.PixArtImageProcessor
IPAdapterMaskProcessor
[[autodoc]] image_processor.IPAdapterMaskProcessor