当前位置:AIGC资讯 > AIGC > 正文

Stable Diffusion 新手入门手册

可以使用括号人工修改提示词的权重,方法如:

(word) - 将权重提高 1.1 倍 ((word)) - 将权重提高 1.21 倍(= 1.1 * 1.1) [word] - 将权重降低至原先的 90.91% (word:1.5) - 将权重提高 1.5 倍 (word:0.25) - 将权重减少为原先的 25% (word) - 在提示词中使用字面意义上的 () 字符

( n ) = ( n : 1.1 ) (( n )) = ( n : 1.21 ) ((( n ))) = ( n : 1.331 ) (((( n )))) = ( n : 1.4641 ) ((((( n )))) = ( n : 1.61051 ) (((((( n )))))) = ( n : 1.771561 )

请注意,权重值最好不要超过 1.5。

还可以通过 Prompt Editing 使得 AI 在不同的步数生成不一样的内容,譬如在某阶段后,绘制的主体由男人变成女人。

语法为:

[to:when] 在指定数量的 step 后,将to处的提示词添加到提示
[from::when] 在指定数量的 step 后从提示中删除 from处的提示词
[from:to:when] 在指定数量的 step 后将 from处的提示词替换为 to处的提示词

例如: a [fantasy:cyberpunk:16] landscape 在一开始,读入的提示词为: the model will be drawing a fantasy landscape. 在第 16 步之后,提示词将被替换为:a cyberpunk landscape, 它将继续在之前的图像上计算
又例如,对于提示词为: fantasy landscape with a [mountain:lake:0.25] and [an oak:a christmas tree:0.75][ in foreground::0.6][ in background:0.25][shoddy:masterful:0.5],100 步采样, 一开始。提示词为: fantasy landscape with a mountain and an oak in foreground shoddy 在第 25 步后,提示词为: fantasy landscape with a lake and an oak in foreground in background shoddy 在第 50 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background masterful 在第 60 步后,提示词为:fantasy landscape with a lake and an oak in background masterful 在第 75 步后,提示词为:fantasy landscape with a lake and a christmas tree in background masterful

提示词还可以轮转,譬如

[cow|horse] in a field

在第一步时,提示词为“cow in a field”; 在第二步时,提示词为"horse in a field.“; 在第三步时,提示词为"cow in a field” ,以此类推。

Token

实际上,程序是将输入的关键词以 Token 的形式传入模型进行计算的:

“ (Medieval astronomer using a telescope with a cosmic starry sky in the background.sketch, hand draw style, con, uncomplicated background )”转换为 Token ID 即: 263, 10789, 40036, 1996, 320, 19037, 593, 320, 18304, 30963, 2390, 530, 518, 5994, 8, 11, 263, 5269, 267, 2463, 4001, 1844, 267, 5646, 267, 569, 16621, 5994, 264 。

一个单词可能对应一个或多个 Token,多个单词也可能对应同一个 Token。

提示词模板

可参考Civitai | Stable Diffusion models, embeddings, hypernetworks and more中优秀作品的提示词作为模板。

类似的网站还有:

Majinai:MajinAI | Home 词图:词图 PromptTool - AI 绘画资料管理网站 Black Lily:black_lily Danbooru 标签超市:Danbooru 标签超市 魔咒百科词典:魔咒百科词典 AI 词汇加速器:AI 词汇加速器 AcceleratorI Prompt
NovelAI 魔导书:NovelAI 魔导书 鳖哲法典:鳖哲法典 Danbooru tag:Tag Groups Wiki | Danbooru (donmai.us) AIBooru:AIBooru: Anime Image Board
Controlnet

Controlnet 允许通过线稿、动作识别、深度信息等对生成的图像进行控制。

请注意,在使用前请确保 ControlNet 设置下的路径与本地 Stable Diffusion 的路径同步

基本流程
点击 Enable 启用该项 ControlNet Preprocessor 指预处理器,它将对输入的图像进行预处理。如果图像已经符合预处理后的结果,请选择 None。譬如,图中导入的图像已经是 OpenPose 需要的骨架图,那么 preprocessor 选择 none 即可。 在 Weight 下,可以调整该项 ControlNet 的在合成中的影响权重,与在 prompt 中调整的权重类似。Guidance strength 用来控制图像生成的前百分之多少步由 Controlnet 主导生成,这点与[:]语法类似。 Invert Input Color 表示启动反色模式,如果输入的图片是白色背景,开启它。 RGB to BGR 表示将输入的色彩通道信息反转,即 RGB 信息当做 BGR 信息解析,只是因为 OpenCV 中使用的是 BGR 格式。如果输入的图是法线贴图,开启它。 Low VRAM 表示开启低显存优化,需要配合启动参数“–lowvram”。 Guess Mode 表示无提示词模式,需要在设置中启用基于 CFG 的引导。 Model 中请选择想要使用解析模型,应该与输入的图像或者预处理器对应。请注意,预处理器可以为空,但模型不能为空。
可用预处理/模型
canny 用于识别输入图像的边缘信息。 depth 用于识别输入图像的深度信息。 hed 用于识别输入图像的边缘信息,但边缘更柔和。 mlsd 用于识别输入图像的边缘信息,一种轻量级的边缘检测。 它对横平竖直的线条非常敏感,因此更适用于于室内图的生成。 normal 用于识别输入图像的法线信息。 openpose 用于识别输入图像的动作信息。

OpenPose Editor 插件可以自行修改姿势,导出到文生图或图生图。

scribble 将输入图像作为线稿识别。如果线稿是白色背景,务必勾选“Invert Input Color” fake_scribble 识别输入图像的线稿,然后再将它作为线稿生成图像。 segmentation 识别输入图

更新时间 2024-06-30