当前位置:AIGC资讯 > AIGC > 正文

AI绘画小白福音!Stable Diffusion 保姆级教程

大家好,今天,我们就来进行 AI 绘画的文生图实战。(文末附籽料)

unsetunset文生图实战unsetunset

模型安装后之后,就可以开始激动人心的 AI 文生图了,下面我们以文生图为例,一边操作一边讲解提示词的语法和分类,以及出图参数的作用和使用方法。

在开始之前,我们再来回顾一下,我们的需求是让 AI 生成我们所要求的图片。

图片风格由模型本身和提示词决定,不同模型擅长生成不同风格的图片;而图片内容由我们的提示词决定,正向提示词会让图片展示对应内容,也会影响画质,反向提示词会让图片不生成什么内容;同时,提示词也可以分为内容提示词以及画质和画风提示词可以帮助我们将我们需要的图片更加具体准确的描述出来;而出图参数决定生成图片的大小,数量,质量等。

OK,下面是一个实际案例,通过文字来生成二次元图片。

我选择了大模型 「cetusMix_Version3.5」,vae 选择的是 「kl-f8-anime2.ckpt」,这是一个比较通用的二次元 vae 模型。

接下来需要输入提示词让 AI 知道你想要画的内容是什么,所以,我们这里先介绍一下提示词的概念、分类和语法。

提示词概念

什么是提示词 (prompt) ?广义地解释,Prompt 是指用户输入的文本或图像信息,目的是指导模型根据一些特定的需求生成艺术作品,翻译过来就是你告诉 AI,你想要画的内容是什么,画成什么样的一种语言。之前我们提到过,AI 绘画的两种基本形式是文生图和图生图,文生图主要通过文字来传递信息,而图生图则是通过图片和文字一起来传递信息。

提示词包括的内容,是非常广泛的,它可能包括作品主题、画风、形象特点以及一些具体包含的要素,不同的提示词分别向AI描绘了画面风格、人物体貌、服饰特点、场景内容和一些额外的修饰性元素。下面我们介绍一下提示词的分类。

提示词分类

提示词按正向反向可以分为正向提示词和反向提示词,正向提示词的内容是你需要图片生成出来的,而反向提示词的内容是你不想让图片出现的,反向提示词一般用通用提示词就可以了,是为了避免AI 绘制出,低质量,丑的,多手指,少手指等情况出现。。

提示词按内容和画质可以分为两个大类,内容提示词和画质画风提示词,两个大类下面又各有几个小类;。

内容提示词

人物及主体特征

服饰穿搭

发型发色

五官特点

面部表情

肢体动作

场景内容

室内、室外

大场景

小细节

环境光照

白天黑夜

特定时段

光环境

天空

画幅视角

距离 close-up,distant

人物比例 full body,upperbody

观察视角 from above, view of back

镜头类型 wide angle,Sony A7

画质和画风提示词

通用高画质 bestquality,ultra-detailed,masterpiece,hires,8k

特定高分辨率类型 extremelydetailedCGunity8kwallpaper(超精细的8KUnity游戏CG),unrealenginerendered(虚幻引|擎渲染)

插画风 illustration,painting,paintbrush

二次元 anime,comic,gameCG

写实系 photorealistic,realistic,photograph

通用模板

下面给出一个通用模板。

提示词语法

基本语法

提示词需要用英语来书写;

以词组为单位,不需要完整的句子。

通过英文半角逗号 「,」 来分隔提示词。

提示词权重

给提示词加权重,一层原括号是1.1倍,两乘括号就是1.1乘以1.1等于1.21倍;比如 (red ball), ((blue ball)) 。同样的,大括号是1.05倍,方括号是0.9倍。

你也可以在直接在括号中对给提词词加一个冒号,输入数字的权重;比如 (yellow flower:1.5) 。

注意一个词条的权重不能太高,安全范围是0.5到1.5;太高的话,容易毁坏整个画面。

进阶语法

进阶语法对于新手来说基本用不到,之后有机会单独讲解。

ok,那讲解完这些概念之后,我们开始真正的输入提示词,先输入正向提示词,其实也很简单,你可以按照我给出的提示词模板,从下往下一个一个去输入即可,这里我输入的是:

1girl, solo focus, tall female, grey hair, very long hair, purple eyes, large breasts, wide hips, sharp face, jewel-like eyes, serious, tired, wearing long grey coat, black blazer, black legwear, stylish sneakers, accessories, smartwatch, flower hair ornament, cute smile, sitting, cafe, coffee shop ambience, coffee shop aesthetic, snow on window, dawn, window view, massive cityscape, beautiful view, dim-lit ambience, holding coffee, {correct posing}, {detailed clothing}, {detailed body}, {correct body anatomy}, {extremely beautiful and delicate anime face and eyes}, {minute details}, {intricate details}, {delicate}, (masterpiece), (best quality), (wallpaper), (8k hd),

然后输入反向提示器,这个一般是有模板的,可以参考其他大佬的,这里我输入的是

extra fingers,fewer fingers,(low quality, worst quality:1.4), (bad anatomy), (inaccurate limb:1.2),bad composition, inaccurate eyes, extra digit,fewer digits,(extra arms:1.2), easynegative

输入好提示词后,就需要输入出图参数来控制图片质量,大小,生成数量等,下面详细介绍一下出图参数。

出图参数

采样迭代步数

采样迭代步数就是 AI 从噪点图到生成最终图片中间的一个步数,所以步数越多,生成出来的图片越清晰;不过增加步数意味着计算时间也会增加,当采样步数大于20之后,画面的提升并不明显,因此默认采样步数都是20。

采样方法

可以理解为AI 生成图像过程中采用的方法,web UI 提供了很多种方法,不过最常用的也就其中四五种。

Euler的适合生成插画风格,生成的图片比较朴素;DPM2M和2MKarras速度较快;SDE Karras 细节会较为丰富。这些方法的特征都是相对而言的,并不一定准确,还和提示词和模型有关。

采样方法更加推荐带加号的,这些方法都是经过改进的,更加优秀。同时,有些大模型会推荐算法,照做即可。

图片大小设置

图片大小默认为 512*512像素,而将宽度和高度修改到1024像素后,即使是在相同模型和提示词下,像素的图片质感也会更好;但是也不能将图片像素设置的过大,一是你的显显卡显存可能不够,二是图片太大容易出现多手多脚等异常情况,这是因为训练模型的时候更多的是使用分辨率较小的图片。

所以一般方法为使用默认图片大小 512*512像素,同时勾选高清修复,本质为将生成的图片再经过一次图生图,将图片放大,后续会专门针对图片高清化进行讲解。

提示词引导系数

提示词引导系数和之前的提示词权重是一个道理,提示词引导系数的安全范围是7到14。

生成次数和生成数量

生成次数是针对相同的模型和提示词,生成多少次。而生成数量是一次生成几张图片。这里更推荐的是提高生成次数而非生成数量,因为提高生成数量的方法是将多张图片拼在一起,看成一张更大的图片去画的,对设备的要求比较高;而提高生成次数只是将生成图片的步骤重复多次而已,对设备的要求没有这么高。

OK,详细介绍完出图参数之后,我们开始实际的去输入出图参数,这里我输入的是:

Sampler:DPM++ 2M Karras CFG scale:7 Steps:20 Clip skip:2

给一张全图如下:

右边这张图片就是生成结果,可以看出还是很不错的。我们也可以多生成几次,看看效果。

OK,这次的实战就到这里结束了,更多的是起一个抛砖引玉的效果,只有你真正去自己做图,才能知道如何去写提示器和出图参数。

AI工具SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,无需自行查找,有需要的小伙伴文末扫码自行获取。

写在最后

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

若有侵权,请联系删除

总结

### 文章总结:AI 绘画的文生图实战
#### 一、前言
在本文中,我们进行了AI绘画的文生图实战操作。通过实际操作,不仅掌握了AI绘画的基本流程和技巧,还深入学习了提示词(Prompt)的语法、分类和应用,以及出图参数的作用和调整方法。
#### 二、模型选择与准备
- **模型选择**:选择了「cetusMix_Version3.5」大模型和「kl-f8-anime2.ckpt」作为VAE,专注于生成二次元风格的图片。
- **安装与启动**:确保模型成功安装后,即可开始文生图的操作。
#### 三、提示词详解
##### 1. 概念介绍
- **提示词(Prompt)**:用户输入的文本信息,用于指导AI生成特定需求的艺术作品。
##### 2. 分类与语法
- **正向提示词**:直接描述需要图片呈现的内容。
- **反向提示词**:避免因特定因素对图像质量产生负面影响的词汇。
- **内容提示词**:包括人物特征、服饰、发型、五官、肢体动作、场景、环境光照等。
- **画质和画风提示词**:如高画质、特定分辨率类型、插画风格、二次元等。
- **基本语法**:使用英文书写,通过英文逗号「,」分隔,可以使用不同括号调整权重。
- **权重设定**:不同括号([、]、{、})可设定不同权重,安全范围0.5-1.5;也可以直接通过数字设定权重,如`(yellow flower:1.5)`。
##### 3. 实战应用
- **正向提示词**:描述了二次元风格的女孩形象,包括发型、眼神、服饰、配件及场景等元素。
- **反向提示词**:避免生成低质量、多手指等异常情况。
#### 四、出图参数设置
- **采样迭代步数**:步数多则图片清晰度高,但计算时间也增加,一般默认20步。
- **采样方法**:如DPM2M、2MKarras适用于不同需求,推荐使用带加号的优化算法。
- **图片大小**:建议默认512*512像素,或勾选高清修复以放大图片。
- **提示词引导系数**:安全范围7-14。
- **生成次数和生成数量**:推荐提高生成次数而非生成数量,减少对设备的要求。
#### 五、实战结果
- 展示了通过输入提示词和参数设置后生成的二次元图片结果,效果令人满意。
#### 六、资源与学习资料
- **AIGC学习路线**:提供了技术点整理,确保学习内容全面。
- **必备工具**:包括了AI绘画所需的所有工具,安装即可使用。
- **学习笔记**:提供前辈整理的技术笔记,便于深入理解。
- **视频教程**:通过观看视频教程,快速入门并提高技能。
- **实战案例**:通过实际操作案例,将所学知识应用于实战。
#### 七、结语
AIGC技术的未来前景广阔,随着人工智能技术的不断发展,AIGC将在更多领域得到应用,尤其是游戏和计算系统。文末提供的丰富学习资源和工具,将助力感兴趣的伙伴快速入门并精进技能。

更新时间 2024-07-28