当前位置:AIGC资讯 > AIGC > 正文

Datawhale X 魔搭 AI夏令营第四期AIGC方向的实践学习

学习简介

从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习——

适合想 入门并实践 AIGC文生图、工作流搭建、LoRA微调 的学习者参与

学习内容提要:从通过代码实现AI文生图逐渐进阶,教程偏重图像工作流、微调、图像优化等思路,最后会简单介绍AIGC应用方向、数字人技术。

接下来我将对于如何生成一个AI图片和如何参加实践学习进行一个简要的解释和说明。

第一步,参加可图Kolors-LoRA风格故事挑战赛

赛事链接

https://tianchi.aliyun.com/s/ce4dc8bf800db1e58d51263ff357d28f

赛事任务

参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格......

基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性。

评分规则介绍

1. 主观评分

由评委对参赛作品进行投票,评审标准可以从技术运用(40%)、组图风格连贯性(30%)、整体视觉效果(30%)几方面进行评判投票。

2. 客观评分

美学分数仅作评价提交是否有效的标准,其中美学分数小于6(阈值可能根据比赛的实际情况调整,解释权归主办方所有)的提交被视为无效提交,无法参与主观评分。

任务提交格式说明

1.将训练好的LoRA 模型上传到魔搭模型库

LoRA模型命名为:队伍名称-可图Kolors训练-xxxxxx

LoRA 上传地址:魔搭社区

2.作品发布在比赛品牌馆讨论区,魔搭社区

发布标题格式为:天池平台报名队伍名称+LoRA模型链接地址+作品图(8图故事)

第二步,正式开始训练LoRA模型,生成图片

step 1:开通阿里云PAI-DSW试用

链接:​​​​​​阿里云免费试用 - 阿里云

新用户需要注册&绑定阿里云账号
新用户还需要完成阿里云账号的实名认证,直接完成即可
开通免费试用

开通PAI-DSW 试用 ,可获得 5000算力时!有效期3个月!

如果已经开通试用或试用已过期,可以跳过此步骤,使用魔搭免费GPU额度或寻找其他的算力方案。

在魔搭社区进行授权

链接:https://www.modelscope.cn/my/mynotebook/authorization

如果这一步授权失败,可跳过此步骤,继续往下进行

step 2 :报名赛事

赛事链接:https://tianchi.aliyun.com/competition/entrance/532254

点击报名比赛,即可报名成功

step 3 :在魔搭社区创建PAI实例

链接:https://www.modelscope.cn/my/mynotebook/authorization

创建实例,启动!

如果在上一步授权失败,可到阿里云控制台创建 & 打开实例,具体步骤详见下方子步骤

step 4 :打开实例

注意(其他情况)

如果在魔塔无法授权或者点击【打开】无法打开,可到阿里云控制台创建&打开实例

首先,打开管理控制台
其次,创建实例
最后,打开实例
如果之前试用的额度已经过期,可使用魔搭的免费Notebook实例

step 5 :下载baseline文件

1 git lfs install
2 git clone https://www.modelscope.cn/datasets/maochase/kolors.git

step 6 :打开baseline文件

step 7 :安装环境,并重启kernel

安装 Data-Juicer 和 DiffSynth-Studio

Data-Juicer:数据处理和转换工具,旨在简化数据的提取、转换和加载过程

DiffSynth-Studio:高效微调训练大模型工具

重启kernel

在实例中的接下来的代码块内容

1. 数据集的下载和数据集中的图片及元数据的保存

2. 使用Data-Juicer处理数据,整理训练数据文件

3. 使用DiffSynth-Studio在基础模型上,使用前面整理好的数据文件进行训练微调

4. 加载训练微调后的模型

5. 使用微调后的模型,生成用户指定的prompt提示词的图片

step 8 : 根据实例中的代码,依次顺序运行剩余的代码块

step 9 :调整prompt,生成图像

正向描述词:你想要生成的图片应该包含的内容

反向提示词:你不希望生成的图片的内容

step 10 : 运行最后的代码块,最终获得图片

step 11:微调结果上传魔搭

链接:https://www.modelscope.cn/models/create


1. 移动结果文件

创建terminal,粘贴如下命令,回车执行

1 mkdir /mnt/workspace/kolors/output & cd 
2 cp /mnt/workspace/kolors/models/lightning_logs/version_0/checkpoints/epoch\=0-step\=500.ckpt /mnt/workspace/kolors/output/
3 cp /mnt/workspace/kolors/1.jpg /mnt/workspace/kolors/output/
2. 下载结果文件

双击进入output文件夹,分别下载两个文件到本地

3. 创建并上传模型所需要的内容

  点击魔搭链接,创建模型,中文名称建议格式:队伍名称-可图Kolors训练-xxxxxx

这样就算创建完成并发布在创空间讨论区了。

4. 来到创空间,查看自己的模型是否发布

step 12 :关闭PAI实例

链接:https://www.modelscope.cn/my/mynotebook/authorization

运行完成后,别忘了回到魔搭,【关闭】实例,否则会一直消耗你的试用额度!

每小时消耗大概7个试用额度!(总共5000个,有效期三个月)

做完这些步骤以后,这样就完成了一个AI图片,并进行了发表和参赛。

附录

从零入门AI生图原理&实践:Datawhale

总结

### 文章总结:从零入门AI生图原理与实践
#### 学习简介
Datawhale 2024年AI夏令营第四期推出了基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”的AIGC方向学习活动,适合想要入门并实践AIGC文生图、工作流搭建、LoRA微调的学习者。教程内容从基础代码实现AI文生图逐步进阶,涵盖图像工作流、微调、图像优化等思路,并简要介绍AIGC应用方向和数字人技术。
#### 参与流程
##### 第一步:参加可图Kolors-LoRA风格故事挑战赛
- **赛事链接**:https://tianchi.aliyun.com/s/ce4dc8bf800db1e58d51263ff357d28f
- **赛事任务**:
- 基于可图Kolors模型训练LoRA模型,生成多样风格(如水墨画、水彩、赛博朋克、日漫等)。
- 生成8张连贯故事的图片,内容自定义。
- 评估LoRA风格的美感度及连贯性。
- **评分规则**:
- 主观评分:技术运用(40%)、组图风格连贯性(30%)、整体视觉效果(30%)。
- 客观评分:美学分数小于6的提交视为无效。
- **任务提交格式**:
- 将LoRA模型上传到魔搭模型库。
- 作品发布在魔搭社区品牌馆讨论区。
##### 第二步:正式开始训练LoRA模型,生成图片
1. **开通阿里云PAI-DSW试用**:
- 新用户注册并实名认证后,开通PAI-DSW试用,获取5000算力时(有效期3个月)。
- 若已开通或过期,可使用魔搭免费GPU额度或其他算力方案。
2. **在魔搭社区授权并创建PAI实例**:
- 完成授权(如授权失败,可跳过)。
- 创建并启动实例(如授权失败,可在阿里云控制台创建)。
3. **下载并准备baseline文件**:
- 克隆基线仓库并安装必要环境(Data-Juicer和DiffSynth-Studio)。
4. **训练LoRA模型**:
- 下载并处理数据集。
- 使用Data-Juicer和DiffSynth-Studio进行数据处理和模型微调。
5. **生成图像并调整prompt**:
- 加载微调后的模型。
- 使用正向和反向提示词生成图片。
6. **上传模型及结果**:
- 将训练结果(模型和图片)上传至魔搭社区并发布在品牌馆讨论区。
7. **关闭PAI实例**:
- 运行完毕后关闭实例以节省算力额度。
#### 附录
- **学习资源**:Datawhale的从零入门AI生图原理与实践课程。
通过上述步骤,参与者不仅能掌握AI生图的基本原理和技术,还能在实践中锻炼和提升,并有机会参与比赛,展示自己的创作成果。

更新时间 2024-08-15