在微信中阅读,关注公众号:CodeFit
。
创作不易,如果你觉得这篇文章对你有帮助,请不要忘了 点赞、分享 和 关注 我的公众号:CodeFit
,为我的持续创作提供一些动力。
本文参考了不少论文,内容显得有点学院风,阅读起来需要点耐心。
第一章 AIGC 初识
1.1 PGC、UGC 和 AIGC
AIGC 的全称是 Artificial Intelligence Generated Content(人工智能生成内容),它实际上指的是一种内容创建模式。
从内容创建模式的发展来看,从 Web 1.0 时代的 PGC (专业生成内容) 到 Web 2.0 时代的 UGC(用户生成内容),再到现在的 AIGC(人工智能生成内容),我们看到的是 内容创作模式 的巨大变化和进步。
内容制作与发布历经的三大阶段PGC,最早的是 PGC,特点是依赖于专业团队,进行高质量内容的生产,但面临高成本和较慢的创作速度问题。常见如新闻机构、电影制作公司和出版社。
UGC,然后是 UGC,特点是让普通用户参与内容创作,这充分发挥了个人创意,带来了内容的多样化,但较难保证内容的专业性,常见如社交媒体、博客文章和评论。
两者对比,PGC 通常用于需要专业性和质量保证的场合,而 UGC 让内容创作变得更加民主化,增加了社交互动和参与感。
AIGC,目前的 AIGC 则是通过 AI 技术来生成内容以满足用户需求,通过自动化,它可以让内容生成变得更加高效,同时降低成本,被认为是一种更先进的内容生成模式。可以说,AIGC 结合了 PGC 的质量优势和 UGC 的量产及多样性优势,被认为是未来内容生成的主要模式。
1.2 AIGC 发展的三大阶段
AIGC 的发展历程是一个典型的技术进步故事,从最初的基础实验到如今广泛的商业应用,我们把其概括为三个主要阶段,每个阶段都标志着关键技术的进步和应用的扩展。
AIGC 发展三大阶段第一阶段:早期实验和概念验证
在这个最初的阶段,研究人员主要通过基础的编程技术来控制计算机生成内容。
这一时期的标志性成就包括:
1957年,希勒和艾萨克森使用计算机生成了世界上第一首完全由计算机创作的音乐作品,名为《Iliac Suite》。
之后,出现了世界上第一个人机交互式机器人 “Eliza”,其交互模式主要通过 模式匹配 来找到合适的答案,这个阶段的人机交互缺乏深层的语义理解,但是为后续的人工智能发展提供了灵感。
第二阶段:技术成熟和应用扩展
第二个阶段的发展得益于 大数据 的发展和计算能力的提升,使得 AIGC 变得更为可用:
出现了世界上第一部完全由 AI 创作的小说《1 The Road》。
这个时期,微软展示了一种全自动同声传译系统,能在短时间内将英语翻译成中文。
第三阶段:快速发展和商业应用
从 2010 年开始,AIGC 进入了一个快速发展的阶段,这个阶段涌现出了多种创新的模型和应用。
比如,Ian J. Goodfellow 和他的同事们发表了论文 《Generative Adversarial Networks》,即 生成式对抗网络(GAN),主要描述了如何使用现有数据来 生成图片,这极大地推动了 图像生成技术 的发展。
另外,可以被称为奇点时刻的是在 2022 年 11 月,一家名叫 OpenAI 的公司发布了一款能够理解人类语言并生成文本的聊天机器人产品,名叫 ChatGPT,其在短短两个月内,月活跃用户就超过了 1 亿。
目前,ChatGPT 能力在其领域仍处于世界领先的位置。
第二章 AIGC 的 C
在 AIGC 中,C 代表的是 Content(即内容)。
这个术语中的 内容 是广义的,它可以是文本、图像、音频、视频,甚至是互动性的内容,比如一个对话系统。
AIGC 的核心在于利用人工智能技术让内容的创作过程 自动化。
这种自动化过程可以是非常结构化和数据驱动的。
比如自动生成的天气报告;也可以是有高度创造力和个性化的,如故事创作或营销广告文案。
AIGC 可以生成各种类型的内容,如果根据其类型来进行分类的话,可以分为:
文本生成 图像生成 语音生成 视频生成。2.1 文本生成
文本生成涉及到字词和语法的处理。
它主要依赖于 自然语言处理(NLP) 技术来分析和生成语言结构,最终生成可用的文本。
目前的文本生成有三个子领域:
结构化写作: 专注于利用已有的数据结构和格式生成文本。例如,它可以基于最新的经济指标来自动产生财经新闻,或根据比赛实时数据编写体育赛事报道。这种写作方式重视数据的准确表达,适用于需要快速传达事实和信息的场景。
创造性写作: 目的是在文本生成中加入个性化的元素。它不仅要基于数据,还需要理解语境、把握语言风格,进而创作出新颖的内容。创造性写作非常适合编写营销文案、创造社交媒体内容或撰写独特视角的博客文章。
对话式写作: 强调对话能力,能够与用户通过文本信息进行交互。聊天机器人就是此类技术的一个典型例子,比如客服机器人。
还要了解的一点是,在以前,这些 不同类型 的文本生成任务需要使用 不同工具或模型 来完成。
但是,今时今日,基于 Transformer 的模型如 GPT(Generative Pre-trained Transformer) 等,通过 预训练 和 微调 处理,只需要 单一模型 就能够适应各种不同的文本生成任务。
2.2 图像生成
目前,AIGC 图片生成已经让图像的创建和编辑变得更加简单和高效:
图像编辑: 用户可以根据 AI 给出的提示进行图像的修改,包括添加新元素或者调整现有的元素,这使得个性化图像的创作更加直观和容易。
独立生成图像: