当前位置:AIGC资讯 > AIGC > 正文

Stable Diffusion 入门教程之参数详解(下)

      1. 介绍

        上一文中《Stable Diffusion 入门教程之参数详解(上)》对 Stable Diffusion 绘图的常用基础参数进行了解读,本文将继续深入探讨Stable Diffusion绘图的进阶参数,这些参数为用户提供了更多的控制权和灵活性,以便根据创作需求进行精细调整。

        这些进阶参数为Stable Diffusion提供了更多的控制权和灵活性,使用户能够根据自己的创作需求进行精细调整。然而,需要注意的是,调整这些参数可能需要一定的经验和试错,因此建议在使用前仔细阅读本教程,并逐步探索适合自己的参数设置。

     2. 进阶参数

     2.1. 生成批次

        生成批次是指SD一共会生成几批次的图片。这意味着,如果您设置生成批次为3,那么会分三次完成图片的生成任务。每次批次生成结束后,SD会进行内部的计算和处理,然后开始下一批次的生成。这个参数主要影响生成图片所需的总时间。如果您希望更快地得到所有的图片,可以考虑增加生成批次。

    2.2. 批次数量

        批次数量则是指SD在每一批次中生成的图片张数。例如,如果您设置每批数量为5,那么显卡会在每一次批次中生成5张图片。这个参数主要影响每次点击生成按钮时,SD需要处理的图片数量。需要注意的是,每批数量过高可能会导致显存不足,从而导致生成失败。因此,在调整这个参数时,需要根据自己的显卡性能和可用显存来合理设置。

        综合上述这两个参数,您可以计算出每次点击生成按钮时,SD会生成多少张图片。例如,如果生成批次设置为3,每批数量设置为5,那么每次点击生成按钮时,显卡会生成3批次图片,每批5张,总共15张图片。

总批次数和但批数量

     2.3. 提示词引导系数 (CFG Scale)

         提示词引导系数(CFG Scale)在Stable Diffusion中是一个非常重要的参数,它决定了模型在生成图像时对于输入提示词的遵循程度。CFG参数实质上在控制模型输出与文本提示之间的匹配程度,是文本提示对图像生成结果影响力的量化指标。

        当CFG值较低时,模型会拥有更多的自由来发挥创造力,生成的图像可能会与提示词有所偏离,展现出更多的艺术性和原创性。这种情况下,生成的图像可能包含更多的AI创意,有时甚至会产生意想不到的效果,但也更可能包含与提示词不完全相关的元素或场景。

        相反,当CFG值较高时,模型会更加严格地遵循输入的提示词,生成的图像将更贴近文本描述的内容。这有助于确保生成的图像与用户的意图更为一致,但也可能限制了模型的创造性和多样性。在极端高的CFG值下,图像可能会变得过于生硬或不自然,甚至出现伪影。

        默认的CFG值为7,这通常被认为是在创造力和生成准确性之间取得平衡的一个合适值。然而,这并不意味着每个场景或提示词都应该使用这个值。在调整过程中需要根据具体的需求和创作目标,适当地调整CFG值来获得更好的生成结果。

        根据经验,在调整CFG值时,需要注意避免将其设置得过低或过高。过低的CFG值可能导致生成的图像与提示词完全脱节,而过高的CFG值则可能限制模型的创造力并导致图像质量下降。通常建议将CFG值保持在5到16的范围内,以确保生成结果的质量和相关性。

提示词引导系数 (CFG Scale)

2.4.采样器 (Sampler)

        这是SD绘图过程中必选的参数,采样器主要用于去除图像噪声和生成随机图像的过程中。采样器通过收集图像中的像素或数据点,来去除图像中的噪声。这种过程可能涉及对图像进行多次重复处理,以得到更“干净”或更清晰的图像版本。去除图像噪声的方法确实多种多样,不同的方法可能在速度和准确性方面有所权衡。一些方法可能更侧重于快速处理,而另一些方法可能更侧重于得到高质量的图像。

采样器列表

        我提供的这个版本中SD提供了30多个采样器,我们该如何选择呢?其实常用的有三种,分别是 Euler a,DPM++ 2M Karras 和 DDIM,下面主要对这3个采样器做进一步说明。

采样器 说明 适用场景 Euler a

Euler a作为一个用于控制时间步长的参数,在需要快速测试变化且不特别注重结果可重复性的情况下,可以作为一个高效且质量相对不错的祖先采样器选择。

ICON,二次元图像,小场景 DPM++ 2M Karras 这种方法在每个时间步长中执行多次操作,从而能够在同等分辨率下捕捉到更多的细节。这使得它能够在较小的图像尺寸中纳入更多的内容,比如在小图中展示全身,代价是采样速度更慢。 写实人像,复杂场景刻画 DDIM 尝试使用超高步数进行图像生成时,DDIM采样方法尤为适用。随着步数的增加,DDIM能够逐步叠加更多的细节信息,从而在保持高效率的同时,进一步提升图像的细节表现。这使得DDIM成为一个非常适合在追求高质量图像细节时的选择。 写实人像,复杂场景刻画

        没有一个采样器是完美的,也没有一个采样器能够适用于所有情况。不同的采样器都有其独特的优点和局限性,而图像生成的质量和效率也往往受到多种因素的影响。

        在实际应用中,选择采样器需要根据具体的需求和目标来权衡。如果您追求快速生成图像并且对图像质量的要求不是特别高,那么一些速度较快的采样器可能是更好的选择。而如果您对图像质量有更高的要求,愿意牺牲一些时间来获得更精细的细节,那么一些质量更高的采样器可能更适合您。

3. 总结

        至此,Stable Diffusion主要的绘图参数已经介绍完毕,我们需要结合绘图参数各自的特点,和它们之间存在的关联性,不断地进行调整,不停的“抽卡”,以达到最佳的图像生成效果。

前几期必看文章:

        《Stable Diffusion绘图神器,2分钟极速安装教程!(提供安装包)》

        《Stable Diffusion 模型下载和使用方法》        

        《Stable Diffusion 入门教程之参数详解(上)》

总结

**Stable Diffusion进阶参数详解**
在《Stable Diffusion 入门教程之参数详解(上)》的基础之上,本教程旨在为读者揭秘Stable Diffusion的高级参数使用。通过这些进阶参数,用户可以更加精细地控制图像生成过程,实现个性化的创作需求。
**一、前言**
Stable Diffusion 的高阶控制取决于细致的参数调节,这让用户能够在保证生成效率的同时,获得更高质量的图像。然而,调整这些参数需要一定的经验和试错,因此,在探索过程中,请仔细阅读教程并逐步探索适合自己的参数设置。
**二、进阶参数**
1. **生成批次(Batches)与批次数量(Steps Per Batch)**
生成批次确定了将完整的生成任务切分的次数;每批次的图片生成量由“批次数量”设定。例如,当设置为3批次和5步骤时,总共会生成15张图片。过多的“每批数量”可能导致显存不足,影响生成质量,因此需要综合考虑显卡性能进行调整。
2. **提示词引导系数(CFG Scale)**
CFG Scale 是控制模型对输入提示词遵循程度的关键参数。低值带来更高的创意自由,但可能偏离提示词;高值则确保图像与文本描述更一致,但可能影响模型的创造力和图像自然性。根据经验,建议在5至16范围内调整。
3. **采样器(Sampler)选择**
在Stable Diffusion中,采样器扮演去噪和图像随机生成的重要角色。不同的采样器在速度和图像质量上各有侧重。例如,Euler a适用于快速测试,DPM++ 2M Karras擅长细节捕捉,而DDIM在高质量图像生成上表现出色。用户需根据具体需求进行选择。
**三、总结**
稳定扩散技术的深度应用中,绘图的细节设置将直接影响最终的图像生成效果。从生成批次、批次数量到提示词引导系数,再到采样器的选择,每一步的调整都至关重要。希望读者通过不断尝试和实践,找到最适合自己创作需求的最优参数配置。在掌握这些核心知识之后,您将能够更加灵活地运用Stable Diffusion,创作出更加独特和精彩的图像作品。

更新时间 2024-07-18