1 前言
本次是学习内容是Datawhale AI夏令营第四期-AIGC文生图方向的学习笔记。
2 AIGC简介
AIGC(Artificial Intelligence Generated Content)即人工智能生成内容,即人工智能通过学习大量的数据,来实现自动生成各种内容,如文本、图像、音频、视频等,是继专家生产内容、用户生产内容之后的新型内容创作方式。
以下是我在魔搭社区生成的图片示例,也是task1的学习笔记。概览 · 魔搭社区 (modelscope.cn)https://modelscope.cn/my/overview
上边仅仅只是二次元漫画的画风,目前AIGC已经可以生成比较真实的图片甚至是视频了,这也为网络安全带来了诸多挑战。比如下方图片这个博主,第一眼看上去像是真人博主,实际上是机器人。这也是我们要介绍的Deepfake技术。
3 Deepfake技术
Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实,但实际上是由计算机生成的。这种技术通常涉及到深度学习算法,特别是生成对抗网络(GANs),它们能够学习真实数据的特征,并生成新的、逼真的数据。
Deepfake技术虽然在多个领域展现出其创新潜力,但其滥用也带来了一系列严重的危害。在政治领域,Deepfake可能被用来制造假新闻或操纵舆论,影响选举结果和政治稳定。经济上,它可能破坏企业形象,引发市场恐慌,甚至操纵股市。法律体系也面临挑战,因为伪造的证据可能误导司法判断。此外,深度伪造技术还可能加剧身份盗窃的风险,成为恐怖分子的新工具,煽动暴力和社会动荡,威胁国家安全。
是不是觉得AI的发展超乎我们的想象?我是被震惊到了!
4 通义千问
学计算机专业的同学是不是经常遇到代码报错,无从下手的情况,反复修改反复错,代码经常修改到深夜,是不是很崩溃?那么好~,最近我接触了比较好的大模型软件,通义千问。
推荐原因:首先通义千问是国内的大模型,响应速度肯定是比国外的快,为我们节省大量时间;在中文文本理解方面,肯定也是比国外模型好的。此外,通义千问是具有信息查询、语言理解、文本创作等多能力的AI助手。编程与技术支持是它的强项之一。很适合我们计算机专业的小码农成长
5 实战演练
下边我将带领大家沉浸式的操作本次项目--基于话剧的连环画制作
5.1 数据准备
你是一个文生图专家,我们现在要做一个实战项目,就是要编排一个文生图话剧
话剧由8张场景图片生成,你需要输出每张图片的生图提示词
具体的场景图片
1、女主正在上课
2、开始睡着了
3、进入梦乡,梦到自己站在路旁
4、王子骑马而来
5、两人相谈甚欢
6、一起坐在马背上
7、下课了,梦醒了
8、又回到了学习生活中
生图提示词要求
1、风格为古风
2、根据场景确定是使用全身还是上半身
3、人物描述
4、场景描述
5、做啥事情
例子:
古风,水墨画,一个黑色长发少女,坐在教室里,盯着黑板,深思,上半身,红色长裙
通义千问会根据我们的问题,提取关键词,方便我们后续进行文本生成图片操作。
5.2 提示词表格绘制
图片编号
场景描述
正向提示词
反向提示词
图片1
女主正在上课
古风,淡雅色调,一个身穿蓝色汉服的女子,上半身特写,正坐在古色古香的学堂内,聚精会神地聆听夫子讲解,手中轻握毛笔,面前摆放着书简和砚台。
丑陋,变形,嘈杂,模糊,低对比度
图片2
开始睡着了
古风,朦胧光影,同一个女子,上半身,倚靠在窗边,头微垂,发丝轻拂,手中的书卷滑落一旁,沉入梦乡,窗外是静谧的竹林和远处的山峦。
丑陋,变形,嘈杂,模糊,低对比度
图片3
进入梦乡,梦到自己站在路旁
古风,梦幻色彩,全身画面,女子站立于一条蜿蜒的古道旁,周围是盛开的桃花,她穿着一袭粉色衣裳,仰望天空,仿佛在倾听自然的声音。
丑陋,变形,嘈杂,模糊,低对比度
图片4
王子骑马而来
古风,英勇与优雅并存,全身画面,一位英俊的少年骑着骏马缓缓驶来,他身穿金甲,手执长剑,目光坚定,身后是连绵起伏的山脉和晨雾。
丑陋,变形,嘈杂,模糊,低对比度
图片5
两人相谈甚欢
古风,温馨色调,男女主角,上半身,坐于一片花海之中,彼此对视,微笑交谈,女子手持折扇,男子轻轻抚琴,四周环绕着蝴蝶与飞鸟。
丑陋,变形,嘈杂,模糊,低对比度
图片6
一起坐在马背上
古风,浪漫意境,全身画面,女子侧坐于马背上,一手轻扶马鬃,另一手被男子紧握,两人眼神交汇,背景是夕阳下的草原,马儿缓步前行。
丑陋,变形,嘈杂,模糊,低对比度
图片7
下课了,梦醒了
古风,清新的晨光,女子,上半身,突然从梦中惊醒,揉着眼睛,周围是学堂的环境,书卷散落一地,窗外是初升的朝阳。
丑陋,变形,嘈杂,模糊,低对比度
图片8
又回到了学习生活中
古风,日常氛围,女子,全身,回到学堂,与同学们一同读书写字,身旁堆满了书籍,夫子在前方授课,窗外可见忙碌的市井生活。
丑陋,变形,嘈杂,模糊,低对比度
5.3 图片生成
图片生成前,小伙伴们需要学会在魔搭社区PAI实例,详细教程在下边,由Datawhale AI夏令营提供,已经创建过的小伙伴可以直接跳过这一步。Docshttps://datawhaler.feishu.cn/wiki/CMYkwKow0ihxOikg1G9cd9Zhnng
5.4 结果展示
以上便是本次学习实践的成果, 欢迎大家交流学习!
总结
### 文章总结**标题**: Datawhale AI夏令营第四期-AIGC文生图方向学习笔记
**主要内容**:
1. **前言**:
- 介绍了本次学习笔记的背景,即Datawhale AI夏令营第四期关于AIGC(人工智能生成内容)文生图方向的学习内容。
2. **AIGC简介**:
- 定义了AIGC(Artificial Intelligence Generated Content),即人工智能通过学习大量数据自动生成文本、图像、音频、视频等内容的新型创作方式。
- 展示了在魔搭社区生成的二次元漫画风格图片示例,并提到AIGC已能生成更真实的图片和视频,同时引出Deepfake技术的讨论。
3. **Deepfake技术**:
- 解释了Deepfake是一种利用AI技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实。
- 分析了Deepfake技术的创新潜力和滥用带来的危害,包括政治、经济、法律、身份盗窃、恐怖主义等方面的风险。
4. **通义千问**:
- 推荐了国内的大模型软件“通义千问”,强调其在中文文本理解、信息查询、语言理解、文本创作等方面的优势,特别适合计算机专业的学生和开发者。
5. **实战演练**:
- 详细介绍了基于话剧的连环画制作项目,包括数据准备、提示词表格绘制、图片生成等步骤。
- 提供了8个具体场景的图片编号、场景描述、正向提示词和反向提示词,展示了如何使用通义千问提取关键词进行文本生成图片的操作。
- 提供了魔搭社区PAI实例的详细教程链接,供学习者参考。
**结论**:
本次学习笔记通过AIGC和Deepfake技术的介绍,以及通义千问软件的推荐,结合实战项目——基于话剧的连环画制作,展示了AI在内容创作领域的广泛应用和潜力。同时,也提醒了Deepfake技术滥用可能带来的风险和挑战。最后,通过详细的实战步骤和结果展示,鼓励读者交流学习,共同探索AI技术的更多可能性。