Habana Gaudi

🤗 Diffusers 与 Habana Gaudi 通过 🤗 Optimum 兼容。请遵循安装指南安装 SynapseAI 和 Gaudi 驱动程序，然后安装 Optimum Habana：

bash

python -m pip install --upgrade-strategy eager optimum[habana]

要在 Gaudi 上使用 Stable Diffusion 1 和 2 生成图像，你需要实例化两个实例：

[~optimum.habana.diffusers.GaudiStableDiffusionPipeline], 用于文本到图像生成的管道。
[~optimum.habana.diffusers.GaudiDDIMScheduler], 一个 Gaudi 优化的调度器。

当你初始化管道时，你需要指定 use_habana=True 以将其部署到 HPU 上，为了获得最快的生成速度，你应该使用 use_hpu_graphs=True 启用 HPU 图。

最后，指定一个 [~optimum.habana.GaudiConfig]，它可以从 Hub 上的 Habana 组织下载。

python

from optimum.habana import GaudiConfig
from optimum.habana.diffusers import GaudiDDIMScheduler, GaudiStableDiffusionPipeline

model_name = "stabilityai/stable-diffusion-2-base"
scheduler = GaudiDDIMScheduler.from_pretrained(model_name, subfolder="scheduler")
pipeline = GaudiStableDiffusionPipeline.from_pretrained(
    model_name,
    scheduler=scheduler,
    use_habana=True,
    use_hpu_graphs=True,
    gaudi_config="Habana/stable-diffusion-2",
)

现在你可以通过一个或多个提示，以批次方式调用管道生成图像：

python

outputs = pipeline(
    prompt=[
        "High quality photo of an astronaut riding a horse in space",
        "Face of a yellow cat, high resolution, sitting on a park bench",
    ],
    num_images_per_prompt=10,
    batch_size=4,
)

有关更多信息，请查看 🤗 Optimum Habana 的文档和官方 GitHub 存储库中提供的示例。

基准测试

我们使用 Habana/stable-diffusion 和 Habana/stable-diffusion-2 Gaudi 配置（混合精度 bf16/fp32）对 Habana 的第一代 Gaudi 和 Gaudi2 进行了基准测试，以展示它们的性能。

对于 512x512 图像的 Stable Diffusion v1.5：

	Latency (batch size = 1)	Throughput
first-generation Gaudi	3.80s	0.308 images/s (batch size = 8)
Gaudi2	1.33s	1.081 images/s (batch size = 8)

对于 768x768 图像的 Stable Diffusion v2.1：

	Latency (batch size = 1)	Throughput
first-generation Gaudi	10.2s	0.108 images/s (batch size = 4)
Gaudi2	3.17s	0.379 images/s (batch size = 8)

Habana Gaudi ​

基准测试 ​

Habana Gaudi

基准测试