[Diffusion Model 笔记]Score based

概述

本文是观看以下视频的笔记：
https://www.bilibili.com/video/BV1VP411u71p/?spm_id_from=333.788&

论文：Generative Modeling by Estimating Gradients of the Data Distribution (NeurIPS2019)

定义score：对数概率的梯度
核心思路：之前的方法都是学习概率分布本身；现在我们学习score。这样我们就可以根据score指示的方向一步步走到正确的地方
- 首先用某种方法估计出score
- 然后，随机初始化噪声，然后按照score走一步；再走一步；迭代，组中走到正确的位置（走一步怎么走是根据郎之万动力学的公式）

首先套用DDPM的噪声假设， $q\left(\mathbf{x}_t \mid \mathbf{x}_0\right)\sim \mathcal{N}\left(\sqrt{\bar\alpha_t} \mathbf{x}_0, (1-\bar\alpha_t\right)\mathbf{I})$ 或 $\mathbf{x}_t=\sqrt{\bar\alpha_t} \mathbf{x}_0+\sqrt{1-\bar\alpha_t} \boldsymbol{\epsilon}$ （1），
根据高斯分布的定义，写出p(xt)的表达式：
- $p(\mathbf{x}_{t})\propto\exp\{-\frac{(\mathbf{x}_{t}-\sqrt{\bar{\alpha}_{t}}\mathbf{x}_{0})^{\top}(\mathbf{x}_{t}-\sqrt{\bar{\alpha}_{t}}\mathbf{x}_{0})}{2(1-\bar{\alpha}_{t})}\}$
根据这个式子，求出对数梯度：
- $\nabla_{\mathbf{x}_{t}}\log p(\mathbf{x}_{t})=-\frac{\mathbf{x}_{t}-\sqrt{\bar{\alpha}_{t}}\mathbf{x}_{0}}{1-\bar{\alpha}_{t}}$
观察式(1), 发现对数梯度的分母就是 $\sqrt{1-\bar\alpha_t} \boldsymbol{\epsilon}$
也就是说，加在原图上的噪声，和我们要求的pxt的对数梯度，只相差一个系数。所以估计噪声就可以估计出梯度的方向
（个人理解）：这里实际上说明，我们DDPM定义的，通过权重来增加的噪声（x0和噪声的加权和），某种程度上相当于在对数空间直接增加噪声？

问题：在数据密度较低的位置，score的估计往往不准，这样很难走进准确的区域
- 解决方法：给原始数据加噪声，这样原始数据的分布范围就变大了，低密度区域就变小了，能准确估计score的区域就变大了
- 新的问题：噪声加了，原始数据就破坏了呀；噪声越强，破坏越强；噪声越小，score又无法准确估计
- 解决方法：在推理的不同阶段加不同强度的噪声，从大到小
- 这不就是DDPM了吗？噪声按这个权重，早期大，晚期小
注意，似乎是在training和inference的时候都加了噪声了