Stable Diffusion之提示词指南(三)

在上一篇的文章中，我们讲解了Stable Diffusion提示词的高级用法，对于一些高级属性有了了解。如果有不记得的，可以再去看看———Stable Diffusion之提示词指南(二)。今天我们讲解一下负提示词。

负提示词

负向提示词：简单说就是告诉AI你想不要绘制什么，不要在画面中出现的内容。

1-1

可以看到在Web UI页面中负提示词也是和正提示词一样，有一个输入框，一般我们不输入也是可以的。

使用负面提示词是引导图像的另一种好方法，这里放的不是你想要的东西，而是你不想要的东西。它们不一定必须是物体，也可以是样式和不需要的属性。（例如丑陋、变形等）

同时对于v2模型来说，使用负面提示词是必须的。如果没有它，图像看起来会远不如v1的图像。对于v1和SDXL模型来说，它们是可选的，但我经常使用它们，因为它们要么有帮助，要么无害。

比如使用通用的负提示词。

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face, blurry, draft, grainy
丑陋、平铺、手画得不好、脚画得不好、脸画得不好、出框、多余的肢体、毁容、变形、身体出框、解剖结构不良、水印、签名、切断、对比度低、曝光不足、曝光过度、不好艺术、初学者、业余、扭曲的脸、模糊、草稿、颗粒状

比如生成的图片：

1-2

使用负提示词

负提示词是让Stable Diffusion输出结果更符合要求的另一种方式。与需要绘制蒙版的不同，你可以使用负提示词并享受文本输入的所有便利。事实上，有些图像只能通过使用负提示词来生成。

比如下面的例子：

Portrait photo of a man

1-3

好的，我们得到了我们所期望的。毫不奇怪。不过，这些人看上去有些太严肃了。让我们试着把他们的胡子去掉，让它们看起来更亮丽一些。我们来尝试一下提示：

Portrait photo of a man without mustache

1-4

我们这里发现有问题。我们的胡子更加突出！这是怎么回事？罪魁祸首很可能是cross-attention未能将“没有”和“小胡子”联系起来。Stable Diffusion将提示词理解为“男人”和“小胡子”。这就是为什么你会看到他们两个。

那么我们能做些什么来生成没有胡子的男人呢？这是Stable Diffusion做不到的吗？答案就是使用负提示词。如果我们使用提示：

正提示词：

Portrait photo of a man

负提示词：

mustache

1-5

我们终于可以生成一些没有胡子的男人了！同样的使用v2模型您将得到类似的结果。

本例演示了使用否定提示的原理：

如果您看到不想要的内容，请将其放入否定提示中。

负提示词如何工作的

回想一下，在文本到图像调节中，提示词被转换为嵌入向量，然后将其馈送到 U-Net 噪声预测器。在这里实际上有两组嵌入向量，一组用于正面提示，另一组用于负面提示。

正面提示和负面提示是平等的。他们都有 77 个token。您始终可以将其中之一与另一个一起使用或单独使用。

负提示是在采样器中实现的，该算法负责实现反向扩散。要了解负提示如何工作的，我们首先需要了解在不使用负提示词的情况下采样是如何工作的。

无负提示词的采样

在Stable Diffusion的采样步骤中，算法首先在文本提示词的指导下通过条件采样对图像进行一点降噪。然后，采样器通过无条件采样对同一图像进行一点去噪。这完全是无指导的，就好像您不使用文本提示词一样。请注意，它仍然会扩散到一个像样的图像，例如下面的篮球或酒杯，但它可以是任何东西。实际完成的扩散步骤是条件采样和无条件采样之间的差异。重复此过程一定数量的采样步骤。

1-6

在没有负提示词的情况下，扩散步骤是朝着提示并远离随机图像的一步。

带负提示词的采样

负提示是通过劫持无条件采样来实现的。不使用生成随机图像的空提示，而是使用负提示。

1-7

当使用负面提示词时，扩散步骤是朝向正面提示并远离负面提示的步骤。

从技术上讲，积极的提示会将扩散引向与其相关的图像，而消极的提示则会将扩散引向与其相关的图像。请注意，稳定扩散中的扩散发生在潜在空间中，而不是图像中。图像空间中的上述图形仅用于说明目的。如果您对如何在代码级别实现它感兴趣，请参阅这篇精彩的文章。

采样空间

让我们考虑以下采样空间的图示。当我们使用提示“男人的肖像照片”时，Stable Diffusion会从所有男人的整个潜在空间中采样图像，无论有没有胡子。你应该得到有和没有胡子的男人的图像。

1-8

所有男人形象的空间。

当添加负提示词“小胡子”时，“有小胡子的男人”空格被排除。实际上，我们正在对没有胡子的男性的图像进行采样。

所以我们知道负提示会以一种单独修改肯定提示无法实现的方式删除对象或样式。它的工作原理是劫持每个采样步骤中的无条件采样，以便扩散偏离了负面提示中所描述的内容。

如何使用好负提示词

你能把你不想看到的东西放在负面提示词中。它为您提供了另一种控制文本到图像生成的方法。许多人将其视为 Stable Diffusion v1.5 中的可选功能。随着 Stable Diffusion v2 的发布，情况发生了变化。负面提示变得不可或缺。

移除物体

和前面的去掉“胡子”例子类似，假设您在雨天创作了一幅巴黎的画作。正提示词如下：

autumn in paris, ornate, beautiful, atmosphere, vibe, mist, smoke, fire, chimney, rain, wet, pristine, puddles, melting, dripping, snow, creek, lush, ice, bridge, forest, roses, flowers, by stanley artgerm lau, greg rutkowski, thomas kindkade, alphonse mucha, loish, norman rockwell.

Seed种子值如下：