算力平台:
UNet2DModel
UNet 模型最初由 Ronneberger 等人引入,用于生物医学图像分割,但它也常用于 🤗 Diffusers,因为它输出的图像与输入图像大小相同。它是扩散系统中最重要的组件之一,因为它促进了实际的扩散过程。在 🤗 Diffusers 中,有几种不同变体的 UNet 模型,具体取决于其维度数量以及它是否是条件模型。这是一个 2D UNet 模型。
论文的摘要如下:
大量共识认为,深度网络的成功训练需要数千个带注释的训练样本。在本文中,我们提出了一种网络和训练策略,该策略依赖于大量使用数据增强,以更有效地利用可用的带注释样本。该架构由一个收缩路径来捕捉上下文和一个对称的扩展路径,以实现精确的定位。我们展示了这样一个网络可以从非常少的图像中进行端到端训练,并且在电子显微镜堆栈中神经结构分割的 ISBI 挑战中优于先前最好的方法(滑动窗口卷积网络)。使用在透射光显微镜图像(相位对比和 DIC)上训练的相同网络,我们在 2015 年 ISBI 细胞追踪挑战赛的这些类别中以较大优势获胜。此外,该网络速度很快。在最近的 GPU 上,对 512x512 图像进行分割仅需不到一秒钟。完整的实现(基于 Caffe)和训练好的网络可在 http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net 获取。
UNet2DModel
[[autodoc]] UNet2DModel
UNet2DOutput
[[autodoc]] models.unets.unet_2d.UNet2DOutput