学习简介
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习——
适合想 入门并实践 AIGC文生图、工作流搭建、LoRA微调 的学习者参与
学习内容提要:从通过代码实现AI文生图逐渐进阶,教程偏重图像工作流、微调、图像优化等思路,最后会简单介绍AIGC应用方向、数字人技术。
接下来我将对于如何生成一个AI图片和如何参加实践学习进行一个简要的解释和说明。
第一步,参加可图Kolors-LoRA风格故事挑战赛
赛事链接
https://tianchi.aliyun.com/s/ce4dc8bf800db1e58d51263ff357d28f
赛事任务
参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格......
基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性。
评分规则介绍
1. 主观评分
由评委对参赛作品进行投票,评审标准可以从技术运用(40%)、组图风格连贯性(30%)、整体视觉效果(30%)几方面进行评判投票。
2. 客观评分
美学分数仅作评价提交是否有效的标准,其中美学分数小于6(阈值可能根据比赛的实际情况调整,解释权归主办方所有)的提交被视为无效提交,无法参与主观评分。
任务提交格式说明
1.将训练好的LoRA 模型上传到魔搭模型库
LoRA模型命名为:队伍名称-可图Kolors训练-xxxxxx
LoRA 上传地址:魔搭社区
2.作品发布在比赛品牌馆讨论区,魔搭社区
发布标题格式为:天池平台报名队伍名称+LoRA模型链接地址+作品图(8图故事)
第二步,正式开始训练LoRA模型,生成图片
step 1:开通阿里云PAI-DSW试用
链接:阿里云免费试用 - 阿里云
新用户需要注册&绑定阿里云账号
新用户还需要完成阿里云账号的实名认证,直接完成即可
开通免费试用
开通PAI-DSW 试用 ,可获得 5000算力时!有效期3个月!
如果已经开通试用或试用已过期,可以跳过此步骤,使用魔搭免费GPU额度或寻找其他的算力方案。
在魔搭社区进行授权
链接:https://www.modelscope.cn/my/mynotebook/authorization
如果这一步授权失败,可跳过此步骤,继续往下进行
step 2 :报名赛事
赛事链接:https://tianchi.aliyun.com/competition/entrance/532254
点击报名比赛,即可报名成功
step 3 :在魔搭社区创建PAI实例
链接:https://www.modelscope.cn/my/mynotebook/authorization
创建实例,启动!
如果在上一步授权失败,可到阿里云控制台创建 & 打开实例,具体步骤详见下方子步骤
step 4 :打开实例
注意(其他情况)
如果在魔塔无法授权或者点击【打开】无法打开,可到阿里云控制台创建&打开实例
首先,打开管理控制台
其次,创建实例
最后,打开实例
如果之前试用的额度已经过期,可使用魔搭的免费Notebook实例
step 5 :下载baseline文件
1 git lfs install
2 git clone https://www.modelscope.cn/datasets/maochase/kolors.git
step 6 :打开baseline文件
step 7 :安装环境,并重启kernel
安装 Data-Juicer 和 DiffSynth-Studio
Data-Juicer:数据处理和转换工具,旨在简化数据的提取、转换和加载过程
DiffSynth-Studio:高效微调训练大模型工具
重启kernel
在实例中的接下来的代码块内容
1. 数据集的下载和数据集中的图片及元数据的保存
2. 使用Data-Juicer处理数据,整理训练数据文件
3. 使用DiffSynth-Studio在基础模型上,使用前面整理好的数据文件进行训练微调
4. 加载训练微调后的模型
5. 使用微调后的模型,生成用户指定的prompt提示词的图片
step 8 : 根据实例中的代码,依次顺序运行剩余的代码块
step 9 :调整prompt,生成图像
正向描述词:你想要生成的图片应该包含的内容
反向提示词:你不希望生成的图片的内容
step 10 : 运行最后的代码块,最终获得图片
step 11:微调结果上传魔搭
链接:https://www.modelscope.cn/models/create
1. 移动结果文件
创建terminal,粘贴如下命令,回车执行
1 mkdir /mnt/workspace/kolors/output & cd
2 cp /mnt/workspace/kolors/models/lightning_logs/version_0/checkpoints/epoch\=0-step\=500.ckpt /mnt/workspace/kolors/output/
3 cp /mnt/workspace/kolors/1.jpg /mnt/workspace/kolors/output/
2. 下载结果文件
双击进入output文件夹,分别下载两个文件到本地
3. 创建并上传模型所需要的内容
点击魔搭链接,创建模型,中文名称建议格式:队伍名称-可图Kolors训练-xxxxxx
这样就算创建完成并发布在创空间讨论区了。
4. 来到创空间,查看自己的模型是否发布
step 12 :关闭PAI实例
链接:https://www.modelscope.cn/my/mynotebook/authorization
运行完成后,别忘了回到魔搭,【关闭】实例,否则会一直消耗你的试用额度!
每小时消耗大概7个试用额度!(总共5000个,有效期三个月)
做完这些步骤以后,这样就完成了一个AI图片,并进行了发表和参赛。
附录
从零入门AI生图原理&实践:Datawhale
总结
### 文章总结:从零入门AI生图原理与实践#### 学习简介
Datawhale 2024年AI夏令营第四期推出了基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”的AIGC方向学习活动,适合想要入门并实践AIGC文生图、工作流搭建、LoRA微调的学习者。教程内容从基础代码实现AI文生图逐步进阶,涵盖图像工作流、微调、图像优化等思路,并简要介绍AIGC应用方向和数字人技术。
#### 参与流程
##### 第一步:参加可图Kolors-LoRA风格故事挑战赛
- **赛事链接**:https://tianchi.aliyun.com/s/ce4dc8bf800db1e58d51263ff357d28f
- **赛事任务**:
- 基于可图Kolors模型训练LoRA模型,生成多样风格(如水墨画、水彩、赛博朋克、日漫等)。
- 生成8张连贯故事的图片,内容自定义。
- 评估LoRA风格的美感度及连贯性。
- **评分规则**:
- 主观评分:技术运用(40%)、组图风格连贯性(30%)、整体视觉效果(30%)。
- 客观评分:美学分数小于6的提交视为无效。
- **任务提交格式**:
- 将LoRA模型上传到魔搭模型库。
- 作品发布在魔搭社区品牌馆讨论区。
##### 第二步:正式开始训练LoRA模型,生成图片
1. **开通阿里云PAI-DSW试用**:
- 新用户注册并实名认证后,开通PAI-DSW试用,获取5000算力时(有效期3个月)。
- 若已开通或过期,可使用魔搭免费GPU额度或其他算力方案。
2. **在魔搭社区授权并创建PAI实例**:
- 完成授权(如授权失败,可跳过)。
- 创建并启动实例(如授权失败,可在阿里云控制台创建)。
3. **下载并准备baseline文件**:
- 克隆基线仓库并安装必要环境(Data-Juicer和DiffSynth-Studio)。
4. **训练LoRA模型**:
- 下载并处理数据集。
- 使用Data-Juicer和DiffSynth-Studio进行数据处理和模型微调。
5. **生成图像并调整prompt**:
- 加载微调后的模型。
- 使用正向和反向提示词生成图片。
6. **上传模型及结果**:
- 将训练结果(模型和图片)上传至魔搭社区并发布在品牌馆讨论区。
7. **关闭PAI实例**:
- 运行完毕后关闭实例以节省算力额度。
#### 附录
- **学习资源**:Datawhale的从零入门AI生图原理与实践课程。
通过上述步骤,参与者不仅能掌握AI生图的基本原理和技术,还能在实践中锻炼和提升,并有机会参与比赛,展示自己的创作成果。