Skip to content

CMStochasticIterativeScheduler

一致性模型 由 Yang Song、Prafulla Dhariwal、Mark Chen 和 Ilya Sutskever 提出,引入了一种多步和单步调度器(算法 1),能够在一步或少量步骤中生成高质量样本。

论文的摘要如下:

扩散模型在图像、音频和视频生成领域取得了显著进展,但它们依赖于迭代采样过程,导致生成速度缓慢。为了克服这一限制,我们提出了一致性模型,这是一种能够直接将噪声映射到数据的新模型家族。它们支持快速的一步生成,同时仍然允许多步采样以在计算和样本质量之间进行权衡。它们还支持零样本数据编辑,如图像修复、着色和超分辨率,而无需在这些任务上进行显式训练。一致性模型可以通过蒸馏预训练的扩散模型进行训练,或者作为独立的生成模型进行训练。通过广泛的实验,我们证明它们在一步和少量步采样中优于现有的扩散模型蒸馏技术,在 CIFAR-10 上实现了 3.55 的新 FID 记录,在 ImageNet 64x64 上实现了 6.20 的新 FID 记录。当独立训练时,一致性模型成为一种新的生成模型家族,能够在标准基准测试(如 CIFAR-10、ImageNet 64x64 和 LSUN 256x256)上优于现有的单步、非对抗生成模型。

原始代码库可以在 openai/consistency_models 找到。

CMStochasticIterativeScheduler

[[autodoc]] CMStochasticIterativeScheduler

CMStochasticIterativeSchedulerOutput

[[autodoc]] schedulers.scheduling_consistency_models.CMStochasticIterativeSchedulerOutput