如何使用反向提示词?

反向提示词为您提供了另一种控制文本到图像生成的方法。许多人将其视为 Stable Diffusion 1.4 或 1.5 模型中的可选功能。随着Stable Diffusion v2 的发布,情况发生了变化。反向提示词变得不可或缺。

在这篇文章中,我将演练一些反向提示词的使用例子,包括修改内容和修改样式。然后我将演示 v2 模型中反向提示词的重要性。我将演示如何搜索通用的反向提示词。

这是负面提示系列的第二部分。阅读第一部分:反向提示词如何工作

输入反向提示词

许多Stable Diffusion GUI 或 Web 服务都会提供反向提示词。在 AUTOMATIC1111(此处安装说明)中,您在输入提示词的位置下方输入反向提示词。

 

但是,如果您找不到在其他 GUI 或服务中输入反向提示词的方法,请不要感到惊讶。这是 v1 模型中的非官方功能。

使用例

我将介绍一些使用反向提示词的示例,以便您了解可以做什么以及如何调整它。我将在本节中使用v1.5 基本模型,但这些技术适用于 v2 模型。

移除东西

第一个明显的用法是删除您不想在图像中看到的任何内容。假设您生成了一幅巴黎雨天的画作。


提示:巴黎的秋天,华丽,美丽,气氛,氛围,薄雾,烟雾,火,烟囱,雨,湿,原始,水坑,融化,滴水,雪,小溪,郁郁葱葱,冰,桥,森林,玫瑰,鲜花,作者:stanley artgerm lau、greg rutkowski、thomas kindkade、alphonse mucha、loish、norman rockwell。
种子:1923936260

autumn in paris, ornate, beautiful, atmosphere, vibe, mist, smoke, fire, chimney, rain, wet, pristine, puddles, melting, dripping, snow, creek, lush, ice, bridge, forest, roses, flowers, by stanley artgerm lau, greg rutkowski, thomas kindkade, alphonse mucha, loish, norman rockwell. Seed: 1923936260

您想生成另一条街道,但只是一条空荡荡的街道。你可以做的是使用相同的种子值,它指定图像,并添加反向提示词“people”。您会得到一张删除了大多数人的图像。

 

请注意,该场景与原始场景非常相似,但并不完全相同。如果您确实需要原版,则需要使用inpainting来煞费苦心地去除人物,同时保持场景连贯。

您可能已经注意到,上图中还剩下一个人。您可以通过强调反向提示词来告诉Stable Diffusion要更加努力(people:1.3)。这告诉Stable Diffusion该关键字people现在重要性增加了 30%。

 

请记住,虽然您可以在AUTOMATIC1111中使用关键字强调,但并非所有服务都普遍支持它。

修改图像

您可以以通过反向提示词做出细微的改变。您并不想删除任何内容,而是想对主题进行一些细微的更改。

让我们处理这个基础图像:


提示:艾玛·沃特森作为自然魔法天体,自上而下的姿势,长发,柔软的粉红色和白色透明布,空间,D&D,闪亮的背景,复杂,优雅,高度详细,数字绘画,艺术站,概念艺术,光滑,锐利的焦点,插图,artgerm,布格罗。
种子:479804672

emma watson as nature magic celestial, top down pose, long hair, soft pink and white transparent cloth, space, D&D, shiny background, intricate, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, artgerm, bouguereau. Seed: 479804672

看起来风很大,头发都在飘扬。让我们用反向提示词“windy”来保持头发向下

 

原图中的艾玛看起来有点不够成熟。使用“未成年underage”这样的反向提示词让她看起来更像成年人

 

如果我们可以接受风,但希望头发遮住耳朵怎么办?让我们添加具有不同权重因素的反向提示词“ear” 。下面是三个逐渐强调的 1.3、1.6 和 1.9。

(ear:1.3)
(ear:1.6)
(ear:1.9)

 

在所有权重因子中,耳朵都被头发覆盖,但当因子达到 1.9 时,图像的构图发生了变化。反向提示词会强烈影响扩散过程。

带关键字切换的反向提示词

现在,如果您确实想使用高度强调该怎么办(ear:1.9)我不知道你的耳朵有什么问题,但我有一个窍门给你。您可以使用关键字切换,首先使用无意义的单词作为否定提示,然后(ear:1.9)在稍后的采样步骤中切换。

让我们选择“the”作为无意义、无用的反向提示词。你可以通过将其放入反向提示词来验证它的无用性。您将获得与未放置任何内容相同的图像。现在用它作为反向提示词:

[the:(耳:1.9):0.5]

[the: (ear:1.9): 0.5]

由于我使用 20 个采样步骤,这意味着“the”在步骤 1 – 10 起作用 ,(ear:1.9)步骤 11-20 中起作用。

这背后的原因是扩散过程在开始步骤中最为重要。后面的步骤只是对细节进行更精细的调整,例如覆盖耳朵的毛发。

现在我们所取得的成就简直令人惊叹。

  • (ear:1.9)我们现在可以在不改变构图的情况下使用更强的强调。
  • 我们得到了一张更接近原始图像的图像。
  • 耳朵被盖住了。

修改样式

反向提示词不仅对修改内容有用,对修改风格也有用。为什么要用反向提示来改变风格?有时,在正向提示词中添加太多只会让扩散器感到困惑。想象一下有人告诉你同时去 77 个(token限制)个地方。如果他们告诉您应该避免哪些区域,将会很有帮助。

锐化

您可以在反向提示中使用“模糊blurry”,而不是在提示词中使用关键字“尖锐”、“集中”。图像确实变得更清晰。

 

逼真

使用反向提示词painting, cartoon使其更像照片。

 

如果你想保留原来的构图,你可以尝试我之前提到的关键词切换。使用[the: (painting cartoon:1.9): 0.3]我们得到:

 

它更接近原版,但增加了照片写实主义风格。

反向提示词对于 v2 模型很重要

Stable Diffusion v2.1 的反向提示

与Max Woolf 的发现一致,我自己的经验是反向提示词对于 v2 模型非常重要。下面我使用正面提示词来生成逼真的人类,但使用 2.1 模型。

一位年轻女性,头发亮点,坐在餐厅外,棕色眼睛,穿着裙子,侧光

a young female, highlights in hair, sitting outside restaurant, brown eyes, wearing a dress, side light

 

只需添加两到三个反向提示词即可逐渐改善图像的美感。我想说这与 v1 模型的质量非常接近。

Stable Diffusion v1.5 的反向提示

让我们在v1.5 模型上重复练习。

 

v1.5 中不添加反向提示词的图像效果也非常好。添加否定提示ugly, deformed and disfigured 可能会有所改善,但不如 v2.1 中那么明显。就好像 v1.5 模型不理解这些词一样。

为什么反向提示词在 v2 中变得更加重要?

这是我只能推测的领域……但为什么不呢?v2 中的两个变化

  1. 使用更大的 OpenCLIP 语言模型。
  2. 过滤掉了训练数据中的 NSFW(not sage for work,违规内容) 内容。

第一个猜测是从 Open AI 的 CLIP 模型切换到 OpenCLIP。这会影响模型的嵌入Embedding。Open AI 使用专有数据训练 CLIP 模型。如果数据经过精心策划,每个人看起来都远高于平均水平,那么提示词“女人woman”将与提示词“美丽的女人beautiful woman”相同。这将使提示词变得更容易。

我的第二个猜测是,那些被视为 NSFW 的东西也可能具有高度的审美性。这可能是过滤器故障,或者只是 NSFW 图像的本质。排除 NSFW 图像也会无意中使数据偏向于不好和丑陋的方面。

v2 模型中的样板反向提示

我们已经谈到了 v2 中反向提示词的重要性。现在让我们找到一个好的通用反向提示词。

寻找好的反向提示

我将使用2.1 模型(512 像素)进行此测试。没有反向提示词的原件是

 

不错,但可以改进。使用我们的极简反向提示词,我们立即看到改进:


反向提示词:丑陋、毁容、变形

ugly, disfigured, deformed

添加underexposedoverexposed有助于使图像变得不那么平坦。

反向提示词:曝光不足、曝光过度、丑陋、毁容、变形。

underexposed, overexposed, ugly, disfigured, deformed.

添加也没什么坏处low contrast

反向提示词:对比度低、曝光不足、曝光过度、丑陋、毁容、变形

low contrast, underexposed, overexposed, ugly, disfigured, deformed

接下来,我们来测试一下网上流传的这种常见的 v2 反向提示词:

丑陋、平铺、画得不好的手、画得不好的脚、画得不好的脸、超出框架、多余的肢体、毁容、变形、身体超出框架、模糊、不良解剖结构、模糊、水印、颗粒状、签名、切断、草稿

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft

 

我认为它做得不错,尽管它可能稍微修改了风格。这可能是由反向关键字blurry, blurred, grainy, draft引起的。有些款式可能看起来就是这样。删除这些关键词似乎更接近原来的风格。

方向提示词:丑陋、平铺、手画得不好、脚画得不好、脸画得不好、出框、多余的肢体、毁容、变形、身体出框、解剖结构不良、水印、签名、被切断

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off

接下来,添加我们刚刚使用的照明关键字 ( low contrast, underexposed, overexposed)。它确实有助于对比度和动态范围。

反向提示:丑陋、平铺、手画得不好、脚画得不好、脸画得不好、出框、多余的肢体、毁容、变形、身体出框、解剖结构不良、水印、签名、被切断、对比度低、曝光不足、曝光过度

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed

现在添加一些反向关键字以避免采样糟糕的艺术或新手绘画,我们到达下面的最后一个反向提示词。这是一个相当不错的样板反向提示词,不会影响样式。

丑陋、平铺、手画得不好、脚画得不好、脸画得不好、出框、多余的肢体、毁容、变形、身体出框、解剖结构不良、水印、签名、切断、对比度低、曝光不足、曝光过度、不好艺术, 初学者, 业余, 扭曲的脸

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face

 

与没有反向提示词相比,这是一个巨大的改进。如果是这种风格,您可能需要去除低对比度、曝光不足或曝光过度的效果。

通用反向提示

我们将把我们刚刚发现的 v2 的通用反向提示词放入一组测试中,看看它的表现如何。

丑陋、平铺、手画得不好、脚画得不好、脸画得不好、出框、多余的肢体、毁容、变形、身体出框、解剖结构不良、水印、签名、切断、对比度低、曝光不足、曝光过度、不好艺术, 初学者, 业余, 扭曲的脸

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face

摄影风格

提示词:

一个男人在她的邻居周围行走,突出头发,详细的眼睛,锐利的焦点,年轻的脸,完美对称的脸,瞳孔反射周围环境,逼真的皮肤,柔软健康的皮肤

A man walking around her neighborhood, highlight hair, detailed eyes, sharp focus, young face, perfect symmetric face, pupil reflecting surroundings, realistic skin, soft healthy skin
无反向提示词
有反向提示词

 

通用的反向提示词与照片风格的图像配合得很好。这家伙看上去高大上很多,而且早上肯定在头发上花了更多的时间……

动漫风格

提示词:

战场上的动漫风格女孩,拿着忍者剑,细致的眼睛,完美的脸

anime style girl on battleground, holding a ninja sword, detailed eyes, perfect face
无反向提示词
有反向提示词

 

通用的反向提示词对动漫风格的角色同样有帮助。看起来,对象站得更好,更英俊,也更愿意战斗。忍者刀直立起来,看起来更加危险。

油画风格

约翰·萨金特的印象派油画,画中一名年轻人站在一辆红色特斯拉跑车旁边

impressionist oil painting of a young man standing right next to a red tesla roadster by john sargent
无反向提示词
有反向提示词

通用的反向提示词对特斯拉和这个家伙都有帮助。现在它不再展示一辆爆胎的破旧汽车和一个陷入困境的青少年,而是展示一辆闪亮的新车和一个看起来有百万美元的年轻人。

结论

看起来这个 v2 通用反向提示词在各种风格下都很有效!

《如何使用反向提示词?》有5条评论

发表评论