非常感谢Jacky为飞链云版图编写的第一篇用户新手教程——飞链云官方!
前言:
在接触飞链云版图(以下简称飞链云AI)之前,笔者曾使用过 sd(stable diffusion)各版本、 wAIfu diffusion、novel AI等各主流AI绘画工具来跑图。但苦于无论是sd还是novel AI都难以轻易达到要求,只能通过反复调试各项参数去追求心目中最好的质量,直到飞链云AI的推出。简约的ui交互,优秀的模型资源,预设稳定的模型参数,强劲的算力,让笔者能够精准出图,高效出货,辅助笔者真正意义上实现“心想图成”。
这是一篇指南,旨在为刚刚接触飞链云AI的萌新快速上手AI作画。
笔者将简单分析飞链云AI基础逻辑和应用,如有错误或疏漏之处,也请多多包涵。
本文基于笔者对无数高阶魔法测试的经验与tag进行挖掘所得成果总结而成,且包含许多个人理解和主观观点。非常欢迎各位前往交流群讨论。
*由于本指南内容较多且篇幅较长,请妥善利用导航及文档内搜索功能寻找需要的资料。
*以下所有实例均由飞链云AI出图
麻瓜:什么是魔法?
什么是魔法?
在深度学习中,我们使用一段 prompt 来引导 AI 使用“噪点图”叠放然后超量召唤出我们最后的图像。
飞链云AI 是一个基于 stable diffusion 的模型,因此它的工作原理与 stable diffusion 并无两样,依赖prompt(提示词)来帮助AI筛选、融合图片。
prompt通常由各种tag来构成,tag通常由英文构成,主要内容为以逗号隔开的单词/词组/短句。tag也可以包括其它语言的文字,甚至可以识别表情符号。
AI会通过寻找符合关键词描述的方向而有明确指向地去噪点(diffuse)。同样如果包含 negative prompt (负面提示词),AI就会尽可能避免含有负面相关要素的部分。换句话说,prompt + negative prompt就像是魔法世界的神奇咒语,它直接决定了最终我们会得到什么。
AI对于tag的辨识也是有顺序规律的,通常以从前到后为顺序,以逗号为分割。对于基本操作,可以以大括号、小括号、中括号调整权重。在飞链云AI中,小括号()增加为 1.1 倍权重,中括号[ ]减弱为 0.91 倍权重(相当于除以 1.1),多次套括号((()))效果相乘。但大括号{}在飞链云AI中默认并没有用,通常{}会增加为 1.05 倍权重。
因此,一针见血的tag(关键词/标签)才是我们所需要的,也是你施法成功的关键!
麻瓜首选魔法装备:飞链云AI
AI绘画中,要让魔法一次成功可不容易,充分的施法准备,能让你事半功倍。
我们先来看看飞链云AI它帮我们做了哪些施法准备:
1.采样方法优选(sampling method optimization)
采样方法组成了图片生成的第一大要素,它决定同样的 prompt 下 AI 会选择以何种方法去噪点化以得到最终图片。同时,它还会决定运算速度。
而对萌新而言,EULER A、EULER、LDM、LMS、PLMS、DPM2 A / DDIM、DPM++等等一大堆的采样方法,根本无从理解和选择!
而在飞链云AI这里一切都不是问题,因为策划组已经很贴心的进行优化并为特定模型匹配了最适合的采样方法。让萌新可以轻松上手,一键施法!
2.采样次数/迭代数量优化(sampling steps optimization)
对于懂得渲染知识的同学,采样次数肯定不陌生,这一个复杂的参数,会影响各画幅下图像的直接质量,举个例子:例如 DPM A 和 EULER A 都是所谓的非线性迭代方法,它们的结果并不会因为迭代增加而无休止地变得更加优秀,在大于一定的迭代值之后反而质量会快速下滑。而 DDIM / EULER 等线性迭代方法则恰恰相反,质量往往依托于迭代的次数。但也存在边际效应的问题,当迭代大于一定程度时,再增加迭代次数也不会让画面产生显著变化。
如果你觉得完全没听懂,那就对了,因为在飞链云AI这里,策划组已经将采样次数与画幅与模型与采样方法进行了优化绑定,让你无需学习渲染知识和了解算法,从而轻松获取高质量的图片。
3.模型优选(model optimization)
AI绘画中的模型训练是一个费时、费力、费显卡、费硬盘的过程,行业术语叫炼丹,飞链云AI集成了大量训练度高优质稳定的模型,同时保持较高的模型更新频率,极大程度的降低了大家选择、训练模型的时间成本。
魔法师学徒:第一次施法
下面进行我们第一次施法尝试,我们将:
masterpiece, 1 girl, cute face, white hair, red eyes
填入画作想法(prompt)中,英文好的同学会发现,原来是召唤一个白发红眼妹纸(笔者的xp好奇怪啊),然后将:
low res, bad anatomy, bad hands, text, error, missing fingers,
extra digit, fewer digits, cropped, worst quality, low quality,
normal quality, jpeg artifacts, signature, watermark, username,
blurry, bad feet
填入排除(negative prompt)中,这个我们称为通用反咒,主要为了尽量防止出现坏手坏脚,奇怪文字,模糊不清等种种负面状况。注意这里是尽量防止,并不能完全阻止。
然后选择你一个你喜欢的模型,如二次元模型,画布大小1:1,精细度超高,想法匹配度高,开启画面修复+放大,进行召唤吧~
如果充分理解了前文内容,并且吟唱地不那么夸张,那么恭喜你,你的第一次施法无惊无险地获得了成功。现在你已经脱离麻瓜范畴,拥有成为魔法学徒的潜质了,向着魔法世界的大门前进吧!
魔法咒语的进阶吟唱
下面我们讲讲咒语正确吟唱的关键:“权重”,之前有提到关于 ( )、[ ] 的使用。以防刚把魔杖捂热的新魔法师看到这里已经忘了它们是什么意思,我们重新回忆下:
AI对于tag的辨识也是有顺序规律的,通常以从前到后为顺序,以逗号为分割。对于基本操作,可以以小括号、中括号调整权重。在飞链云AI中,小括号()增加为 1.1 倍权重,中括号[ ] 减弱为 0.91 倍权重(相当于除以 1.1),多次套括号如 (( )) , ((( ))) 效果多倍相乘。
这里要重点说明的是,如果因为某些需求而要大量提高某tag的权重,可以对该tag进行多次括号,比如((((red hair)))),这意味着将red hair的权重 * 1.1四次,也就是 1.4641。但这个写法吓人了,数括号也很浪费时间,所以可以直接为这个tag赋予权重:
(tag:权重乘数) 如 (red hair:1.5)
外层一定是小括号而非其它括号,比如 (red hair:1.5) 将直接给 red hair 赋予*1.5权重,清晰简洁,便于自己回顾和他人理解,强烈推荐。
请不要做出诸如 ((red hair:1.5)) 的奇怪写法。虽然权重能够正确叠乘,但在多重权重同时计算的情况下则会导致此权重无效!!!
而除了整词权重之外,也可以进行部分权重,比如如下例子:
1 girl, white long (messy:1.2) hair, red eyes将专门对 messy 部分赋予 *1.2 权重,其它部分不受影响。
(messy是凌乱的意思,以后自己翻译哦)
高权重的元素会在画面中有着“更大的占比”或“更强烈的存在感”或“更多的数量”,是能可观地影响构图的原因之一。笔者非常不建议给出十分离谱的权重值,三个小括号也只有 1.3 左右,而一般来说 1.6 就已经很极端地占据画面了,再高至例如 2.0 只会在大多数情况下让咒语变成召唤古神!
划重点:通常情况下,核心tag权重不要超过1.5
高级咒语解析
上述的小括号、中括号与带权重小括号都属于低阶语法,而接下来要介绍的是更长更复杂一些的高阶语法。
高阶语法都以中括号 [ ] 作为外层包括,
包括分步描绘,融合描绘两种,
使用高阶语法时这一对中括号不会让权重降低。
高阶语法内可以嵌套低阶语法,低阶语法内也可以嵌套高阶语法,在理解高阶语法的时候,大家需要有一个渲染步数的概念。简单点解释,大家可以把渲染步数想象成一个进程。
首先介绍分步描绘的各种形式:
[from:to:step]
[from::step] (to 为空)
[:to:step] (from 为空)
它的作用是让tag在达到step之前被视为from,在达到后视为to。若是在对应位置留空则视为无对应元素。step为大于1的整数时表示步数,为小于1的正小数时表示总步数的百分比。(目前版本的飞链云AI不开放step配置,使用高级咒语时请设定为正小数)
这样讲,有些复杂,举个实例来便于理解:
比如a girl with [green hair:red hair flower:0.2]