在 Google Colab上运行 Stable Diffusion WebUI (AUTOMATIC1111)

这是使用 Google Colab 运行 AUTOMATIC1111 的指南。这是使用 AUTOMATIC1111 最简单的方法之一,因为您不需要处理安装。

如果您希望在本地运行,请参阅Windows PCMac上的安装说明。

Google 已禁止通过免费帐户使用 Stable Diffusion。您需要付费计划才能使用。

 

什么是 AUTOMATIC1111?

如果您想成为Stable diffusion的忠实用户,您应该知道AUTOMATIC1111是什么。您可以选择不使用它。但你需要知道它能做什么

Stable diffusion是一种机器学习模型。其本身并不是很用户友好。您需要编写代码才能使用它。大多数用户喜欢使用GUI(图形用户界面)来使用Stable diffusion我们不编写代码,而是在文本框中编写提示词并单击按钮来生成图像。

AUTOMATIC1111 是最早为Stable diffusion开发的 GUI 之一。

AUTOMATIC1111 功能丰富:您可以在该 GUI 中使用文本生成图像、图像生成图像、放大、深度生成图像以及运行和训练自定义模型。本网站上的许多教程都是使用此 GUI 进行演示的。

什么是 Google Colab?

Google Colab是 Google 提供的一项交互式计算服务。

他们提供三种付费计划——Pay As You Go、Colab Pro 和 Colab Pro+。如果您决定付费,我建议使用 Colab Pro 计划。它每月为您提供 100 个计算单元,这在标准 GPU 上大约需要 50 小时。(这很便宜)您还可以获得高 RAM 机器,这对于某些 v2  模型很有用。

通过付费计划,您可以选择使用高级 GPU它是A100处理器。当您需要快速训练 Dreambooth 模型时,这会派上用场。

如果您将 Colab 用于 AUTOMATIC1111,请务必在完成后断开连接并关闭notebook。当notebook保持打开状态时,它将消耗计算单元。

运行 Colab notebook的分步说明

步骤1打开快速入门指南中的 Colab 笔记本您应该看到类似下面图的界面。

步骤 2.检查用户名和密码。启动 AUTOMATIC11111 后您将需要凭据。

步骤 3.检查Save_In_Google_Drive选项。有三个选项可供选择。

  1. Everything 一切:将整个 AUTOMATIC1111 Stable Diffusion webui 保存在您的 Google Drive 中。此选项需要更多维护。仅建议高级用户使用。
  2. Small models, images and settings 小模型、图像和设置保存 Lora 模型、Embedding、GUI 设置和 Google 云端硬盘中的所有图像。它将从您的 Google 云端硬盘加载以下内容。
  • 模型(来自output_path/models 文件夹)
  • Upscalers(来自output_path/ESRGAN 文件夹)
  • Lora 模型(来自output_path/Lora 文件夹)
  • Embedding(来自output_path/embeddings 文件夹)

3.Nothing :不会使用您的 Google 云端硬盘。断开连接后,所有数据和图像都将被删除。

如果您选择第一个或第二个选项,您必须授予访问 Google 云端硬盘的权限。

步骤4检查您要加载的模型。目前我们提供 v1.4、v1.5、v1.5 Inpainting、F222、anything v3、inkpunk Diffusion、Mo Di Diffusion、v2.1-512、v2.1-768 和 v2 Depth Model。

如果您是首次使用,可以选择v1.5型号。

如果您选择将所有内容保存在 Google 云端硬盘中,模型将下载到您的 Google 云端硬盘中。

步骤 6.单击单元格左侧的“播放”按钮开始。如果您没有订阅专业版,它可能会警告您需要高内存。如果您不使用 v2.1 768 px 模型,则可以忽略该警告。

步骤 7.启动应在几分钟内完成。需要多长时间取决于您包含的模型数量。完成后,您应该会看到下面的消息。

步骤8点击gradio.live链接启动 AUTOMATIC1111。

步骤 9 . 输入您在笔记本中指定的用户名和密码。

步骤10登录后您应该会看到 AUTOMATIC1111 GUI。

在提示文本框中输入“a cat”,然后按“Generate”以使用“稳定扩散”进行测试。您应该会看到它生成了一张猫的图像。

ngrok(可选)

如果您遇到 GUI 的显示问题,您可以尝试使用 ngrok 而不是 Gradio 来建立公共连接。它是默认 gradio 连接的更稳定的替代方案。

您需要设置一个免费帐户并获得一个authoken

  1. 前往 https://ngrok.com/
  2. 创建一个帐户
  3. 验证邮件
  4. 从https://dashboard.ngrok.com/get-started/your-authtoken复制 authoken  并将其粘贴到笔记本中的 ngrok 字段中。

输入 ngrok authtoken 后,笔记本中的稳定扩散单元应如下所示。

单击左侧的播放按钮开始运行。加载完成后,您将在单元格下的输出中看到指向 ngrok.io 的链接。单击 ngrok.io 链接启动 AUTOMATIC1111。下面示例输出中的第一个链接是 ngrok.io 链接。

当您访问 ngrok 链接时,它应该显示如下消息

 单击“访问站点”以启动 AUOTMATIC1111 GUI。有时,您会看到一条警告消息,指出该网站访问不安全。这可能是因为有人使用相同的 ngrok 链接来发布恶意内容。由于您是创建此链接的​​人,因此您可以忽略安全警告并继续。

当你完成后

使用完notebook后,不要忘记单击右上角下拉菜单中的“断开连接并删除运行时”。否则,您将继续消耗计算积分。

可供选择的模型

为了您的方便,笔记本电脑可以选择加载一些流行的模型您将在本节中找到它们的简要描述。

v1 模型

v1.4模型

v1.4 模型是第一个公开发布的稳定扩散基础模型。

v1.5模型

v1.5模型在1.4之后发布。这是最后一个 v1 模型。该模型的图像与 v1.4 非常相似。您可以将 v1.5 模型视为默认的 v1 基础模型

v1.5 inpainting模型

专门针对inpainting 局部重绘训练的模型

F222

F222 擅长生成逼真的图像。它擅长产生具有正确解剖结构的女性。

注意:F222 容易生成露骨图像。使用提示词“礼服 dress”或否定提示词“裸体nude”来抑制露骨的图像。

Dreamshaper

模型页

Dreamshaper易于使用,并且擅长生成流行的真实感插画风格。这是一种简单的“作弊”方法,无需良好的提示词即可获得优质图像!

Open Journey Model

模型页

Open Journey 是一个使用Mid Journey v4生成的图像进行微调的模型 它具有不同的美感,是一个很好的通用模型。

触发关键字:  mdjrny-v4风格

Anything v3

模型页

Anything V3 是一种经过训练可生成高质量动漫风格图像的特殊用途模型。您可以在文本提示词中使用 danbooru 标签 (例如 1girl, white hair)。

它对于塑造名人的风格很有用,然后可以与说明性元素无缝融合。

Inkpunk Diffusion

Inkpunk Diffusion 是一个经过 Dreambooth 训练的模型,具有非常独特的插画风格。

模型页

触发关键字:  nvinkpunk

v2 模型

v2模型是Stability AI发布的最新基础模型。一般比较难使用,不建议初学者使用。

v2.1 768模型


示例 2.1 图像。

v2.1-768 型号最新的高分辨率 v2 型号。原始分辨率为 768×768 像素。确保将图像的至少一侧设置为 768 像素。在 v2 模型中使用负面提示词是势在必行的。

您需要 Colab Pro 才能使用此模型,因为它需要高 RAM 实例。

v2.1 512模型

v2.1-512 模型v2.1 模型的较低分辨率版本。

v2 Depth Model

v2 深度模型从输入图像中提取深度信息并用它来指导图像生成。请参阅有关深度到图像的教程

其他模型

以下是您可能感兴趣的一些模型。

在这里查看更多真实模型

Dreamlike Photoreal

模型页面

模型下载地址

https://huggingface.co/dreamlike-art/dreamlike-photoreal-2.0/resolve/main/dreamlike-photoreal-2.0.safetensors

模型擅长生成具有正确解剖结构的美丽女性。与F222类似。

触发关键词:photo

注意:此模型容易生成露骨照片。使用提示词“dress”或否定提示词“nude”来抑制露骨的图像。

Lyriel

Lyriel擅长艺术风格,擅长渲染多种题材,从肖像到物体。

模型下载地址:

https://civitai.com/api/download/models/50127

Deliberate v2

Deliberate v2是一个训练有素的模型,能够生成逼真的插图、动画等。

模型下载地址

https://civitai.com/api/download/models/15236

存储设置:选项-小模型、图像和设置

我推荐大多数用户选择这个选项。这是为了将小数据文件保存到 Google Drive 但大文件需要下载而设计的。因此,您的 Google 云端硬盘不会被Stable diffusion耗尽。

您选择Small models, images and settings选项。以下内容保存在您的 Google 云端硬盘中。

  • 所有生成的图像
  • 图形用户界面设置
  • 最后生成的图像中使用的提示和参数
  • Embedding(路径:AI_PICS/embeddings)
  • Lora模型(路径:AI_PICS/Lora)
  • 升级器Upscalers(路径:AI_PICS/ESRGAN)
  • 超网络Hypernetworks(路径:AI_PICS/hypernetworks)

下次运行colab notebook时,以上所有内容都将可用。

此选项不会在您的 Google 云端硬盘中保存任何模型。但它会加载您放入 AI_PICS/models 中的所有模型。

您只需将您经常使用但不在Notebook的型号列表中的型号放入AI_PICS/models中即可。由于模型文件很大(2 到 7 GB),因此您不希望在 Google 云端硬盘中放入太多模型文件。(Google Drive的免费存储空间只有15 GB)

安装Embeddings

嵌入Embeddings是用于修改样式或注入对象的轻量级文件。要安装嵌入Embeddings,请将文件拖放到stable-diffusion-webui> embeddings

每当您切换模型时,嵌入Embeddings都会重新加载。您将在 Colab 的日志消息中收到确认信息。

安装LoRA

LoRA(Low-Rank Adaptation)模型是可应用于模型checkpoints的小补丁。它们的大小很小,通常在 3-200 MB 之间,因此易于存储。它们是模型的良好替代品。

要安装 LoRA 模型,请将模型拖放到文件资源管理器面板中的目录stable-diffusion-webui > models > Lora中。

如果选择 Use_Google_Drive,LoRA 模型将保存到您的 Google Drive 下的AI_PICS > Lora下。如果您选择相同的选项,下次可以重复使用该模型。

或者,如果您使用 Google Drive 选项,则可以将 Lora 模型放入 Google Drive 的AI_PICS > Lora中。这样上传速度更快。

安装Upscalers 放大器

您可以在 Google 云端硬盘中使用Upscalers 放大器。只需将它们放入Google 云端硬盘的AI_PICS > ESRGAN文件夹中即可。下次当您使用该Use_Google_Drive选项启动笔记本时。

使用 Google 云端硬盘中的模型

您可以使用 Google 云端硬盘中的模型。您必须将模型放置在以下默认位置。

AI_PICS/models

该文件夹中的所有模型都将在启动期间加载。

安装hypernetworks超网络

要安装超网络,请将它们放在以下位置

AI_PICS/hypernetworks

存储设置: 一切Everything

此选项将整个 Stable Diffusion Webui 文件夹保存在您的 Google 云端硬盘中。默认位置是AI_PIC > stable-diffusion-webui。安装模型与 Windows 或 Mac 没有什么不同。下面是文件夹路径

  • 模型:AI_PICS/stable-diffusion-webui/models/Stable-diffusion
  • 放大器Upscalers:AI_PICS/stable-diffusion-webui/models/ESRGAN
  • Lora:AI_PICS/stable-diffusion-webui/models/Lora
  • 嵌入Embedding:AI_PICS/stable-diffusion-webui/embeddings
  • 超网络hypernetworks:AI_PICS/stable-diffusion-webui/hypernetworks

从 URL 安装模型

您可以使用Model_from_URL字段从 URL 安装模型。目前,您只能安装 v1 模型。

从 HuggingFace 安装模型

以下是从 HuggingFace 安装 DreamShaper 的示例输入

https://huggingface.co/Lykon/DreamShaper/resolve/main/Dreamshaper_3.32_baked_vae_clip_fix_half.ckpt

(此模型更新频繁,链接可能不正确)

从 Civita 安装模型

您需要复制用于下载模型的 URL 链接。不要使用模型页面的 URL。

要复制下载链接,请右键单击“下载”按钮,然后选择“复制链接地址”

在 Google 云端硬盘中保存副本

您可以选择使用Save_a_copy_in_Google_Drive在 Google 云端硬盘中保存模型的副本。它们将保存在模型加载位置。AI_PICS/models

下次启动笔记本时,您在 Google Drive 中保存的模型将自动加载。

仅当您使用推荐的设置时才使用此选项:在 Google 云端硬盘中保存小模型和图像。Save small models and images in Google Drive.

从 URL 安装扩展

您可以使用此字段安装任意数量的扩展。您将需要扩展的 Github 页面的 URL。

例如,如果要安装 Civita 模型扩展,请输入以下内容。

https://github.com/civitai/sd_civitai_extension

您还可以安装多个扩展。URL 需要用逗号分隔。例如,以下 URL 安装 Civita 和多重扩散扩展。

https://github.com/civitai/sd_civitai_extension,https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111

webui 的额外参数

您可以使用该Extra_arguments字段向 Web-UI 添加额外的参数。

例如,如果您使用lycoris 扩展,则可以方便地使用额外的 webui 参数--lyco-dir在 Google Drive 中指定自定义 lycoris 模型目录。

其他有用的论点是

Instruct-Pix2Pix

Instruct-Pix2Pix是一种StableDiffusion模型,可让您仅使用文本指令来编辑照片。

要使用 instruct-Pix2Pix 模型,请选中instruct_pix2pix_model复选框。请按照本教程中的说明进行操作。

ControlNet

ControlNet 是一种Stable diffusion模型,可以复制输入图像的构图和姿态。

colab notebook支持 ControlNet。请参阅教程文章

使用Stable diffusion制作视频 (Deforum)

您可以使用 Deforum 扩展程序制作带有文本提示词的视频。请参阅本教程以了解演练。

常见问题

我需要使用 ngrok 吗?

您不需要使用 ngrok 来使用 Colab 笔记本。根据我的经验,ngrok 在浏览器和 GUI 之间提供了更稳定的连接。如果您遇到按钮无响应等问题,您应该尝试 ngrok。

为什么我老是断线?

每次 Colab 笔记本会话开始后不久就会进行人工验证。如果您不回应,您将被断开连接。确保切换回 Colab 笔记本并检查验证。

将所有内容保存在 Google 云端硬盘中是否更快?

第一次速度较慢,因为您需要将内容下载到速度较慢的 Google 云端硬盘。与Google Drive中访问数据的速度有关。

我可以使用我训练的 Dreambooth 模型吗?

是的。模型通常需要转换才能在 AUTOMATIC1111 中使用。但如果你使用我的Dreambooth 教程中的notebook,它已经为你转换好了。

您需要在 Google Drive 选项中选择保存“小模型、图像和设置”。将您的 Dreambooth 模型放入 AI_PICS/models 中。如果需要,您可以重命名模型文件。