Stable Diffusion AI绘画学习指南【常用模型,采样器介绍】

常用采样器、目前有20个采样步骤越多每个步之间的降噪越小，减少采样过程中的截断误差，结果越好

学微分方程求解器

Euler（最简单的采样器，采样过程中不加随机噪声，根据采样计划来执行每个步骤中的噪声，并使用欧拉方法减少适当数量的噪声以适应噪声计划，到最后一步为 0）、Heun（是对 Euler 的更精确的改进，但需要在每个步骤中预算两次噪声，处理速度相对会更慢一些）、LMS（解决学微分方程的标准方法，采样速度与 Euler 相同）

祖先采样器.

随机采样，采样过程具一定的随机性，缺点是图像不收敛

Euler a（在每个步骤中减去比『应该』更多的噪声并添加一些随机的噪声以接近于噪声计划，去噪图像取决于前面步骤添加的特定噪声）、DPM2 a、DPM++2s a、DPM2 a Karras、DPM++ 2S a Karras

官方采样器,最早的采样器算法

DDIM、（使用去噪后的图像来近似最终图像，并使用噪声预测估计的噪声来近似图像方向）PLMS （是 DDIM 的新版且更快速的替代品）DPM 和 DPM++，DPM2（是 katherine Crowson 在 k-diffusion 项目中自创的，灵感来源 DPM-Solever-2 和算法 2，受采样器设置中的 sigma 参数影响）、DPM2 a（祖先采样器的一种，受采样器的 ETA 参数影响）、DPM++ 2s a（祖先采样器的一种，受采样器的 ETA 参数影响）、DPM++ SDE（受采样器的 ETA 参数影响）、DPM fast （用于 steps 小于 20 的情况，受采样器的 ETA 参数影响）、DPM++ 2M（在速度和质量的平衡最好，代表 m 的多步比上面的 s 单步在采样时会参考更多步，而非当前步所以能有更好的质量）、DPM adaptive （2022 年发布的扩散模型的新采样器，DPM2 比 DPM 更准确但速度较慢，DPM++是对 DPM 的改进，可以自适应的调整步长，但会很慢，不能保证在规定的采样步骤内完成.）

带有 Karras 字样的采样器

使用了噪声时间表，控制每个步骤的噪声水平，随着采样步骤的增加，减少了截断误差

UNiPC

是 2023 年发布的，目前最快速的最新的采样方法 UNiPC sampling steps 10、UNiPC sampling steps 20、UNiPC sampling steps 30受 ODE 求解器中预测校正方法启发可以在很少的步骤就可以实现高质量图像生成

常用的采样器

DPM++ 2M karras(20-30 步)、unpic（15-25 步）、如果想要高质量的图，不收敛可以选择 DPM++ SED Karras,DDIM (10-15 步，较快) ，如果要简单的图可以选 Euler,heun 可以减少步骤以节省时间，如果想要稳定可复线的图（Euler a、DPM2 a、DPM++ 2s a、DPM2 a karras、DPM2 ++ 2s a karras,避免采用任何祖先采样器）

常用模型

二次元代表：Anything v5、Counterfeit v2.5、Dreamlike Diffusion、

标签与风格关键词：

illustration,painting,sketch,drawing,painting,comic,anime,catoon

可以使用这些词语为关键词搜索对应的风格模型，也可以使用它们在 Prompt 中激活模型风格特性。

写实代表：Deliberate、Realistic Vision、LOFI(L.O.F.I)

标签与风格关键词：

photography,photo,realistic,photorealistic,RAW photo

可以使用这些词语为关键词搜索对应的风格模型，也可以使用它们在 Prompt 中激活模型风格特性。

2.5D 风代表：NeverEnding Dream(NED)、Protogen (Realistic) 、国风 V3(GuoFeng3) 、lora 卡通证件照（底模：DreamShaper，06-0.9）

风格关键词：

3D、render、chibi、digital art、concept art、{realistic}

可以使用这些词语为关键词搜索对应的风格模型，也可以使用它们在 Prompt 中激活模型风格特性。

模型扩展名的区分

模型的类型（是装着各种图片的容器）官方模型网站：https://huggingface.co

Stable Diffusion 大模型（*.ckpt) 文件是用 pickle 序例化的。这意味着它有可能会包含恶意代码。加载这类型的模型应该确认可靠的来源。

*.safetensors 文件是用 numpy 保存的，这意味着它们只是包含张量数据。没有任何代码。加载*.safetensors 文件更安全快捷。

emb 模型嵌入式模型是一种用于生成图片语言理解组件，它可以接受文本提示并产生 token embeddings，模型有多种不同的训练方法，例如 Textual Inversion，Hypernetwork,Dreambooth 和 LoRA,这几种各有优劣势和应用场景。

VAE 模型，具有颜色的校正功能，可以让生成的图像更加鲜艳或者柔和，初化的图像，可能在这个图像的基础上进行细化和改进。低维的隐空间，可以在这个空间中控制图像的风格和特征。

超网络模型（hypernetworks) 可以用来对 Stable-diffusion 的模型进行风格迁移（style transfer)。

LoRA 模型体积小，适合性能不足的电脑使用，可以用少量的图片训练，训练时间较短，一般用于固定的人物，服装，动作。

模型的安装

官方模型网站 https://huggingface.co

将下载的模型文件放入 stable-diffusion-webui/models/下对应模型类型的文件目录中，在 web UI 的模型选择后面重载，即可看到新加入的模型，models 目录下包含模型，算法，采样器。