一、说明
我们使用扩散概率模型提供高质量的图像合成结果,一类受非平衡考虑启发的潜变量模型热力学。我们的最佳结果是通过加权变分训练获得的根据扩散概率之间的新颖联系设计的界限模型和去噪分数与 Langevin 动力学相匹配,并且我们的模型自然地承认渐进式有损解压缩方案,可以将其解释为自回归解码的推广。
我们的实现可以在 ttps://github.com/hojonathanho/diffusion 上找到。
二、理论与数学
扩散模型通过一系列时间步骤 T (x₀,xₜ) 逐渐降低图像中的信息。在每个步骤中,都会添加少量高斯噪声,最终将图像转换为纯随机噪声,类似于正态分布的样本,这称为前向过程。从 xₜ₋₁ 到 xₜ 的过渡遵循这种噪声添加机制。
为了扭转这一局面,需要训练神经网络逐步消除噪音。经过训练后,模型可以从正态分布中提取的随机噪音开始。它会迭代地对输入进行去噪,每次都会消除一些噪音,直到最终结果是与原始分布相似的清晰图像。
这种方法在概念上与变分自动编码器 (VAE)相似。在 VAE 中,图像被编码为高斯分布的均值和方差,然后解码器通过从该分布中采样来重建图像。同样,扩散模型的去噪过程将随机噪声转换回连贯图像,类似于 VAE 中的重建阶段。
扩散是指分子从高浓度区域向低浓度区域移动。从统计学意义上讲,扩散过程是一种随机马尔可夫过程,其特征是连续的样本