1.什么是AIGC?
早期内容生成方式为专业(人士)生成内容(Professional Generated Content,PGC)。
如:音乐专业人士的创作、设计师的平面设计创作用户生成内容(User Generated Content,UGC)更倾向于指向一种商业运营模式,这种模式下,平台的内容由众多用户贡献,相对于PGC:
缺点是,作品质量参差不齐,一部分甚至有粗制滥造。 优点是,激发了广大用户(非专业人士)的创造力,产生了绝对数量远超PGC的内容,内容形态更加丰富多元。 大数据遴选推荐算法会将优质产品筛选出来,用户的行为构成了庞大的表决机制。 AIGC(AI Generated Content,人工智能生成内容)是指由专业的模型和算法根据用户需求输出符合需求的数字作品,形态包括:图片、音乐、文字和语音等。案例:Midjourney的“太空歌剧院”画作
太空歌剧院是游戏设计师杰森·艾伦使用AI绘图工具Midjourney生成,再经Photoshop润色而来。 https://www.midjourney.com 2022年8月,美国科罗拉多州举办艺术博览会,“太空歌剧院”获得数字艺术类别冠军。
Midjourney绘画展示
10-20-30-40岁招手的中国女性
Prompt(提示词):A pair of young Chinese lovers,wearing jackets and jeans,sitting on the roof,the background is Beijing in the 1990s,and the opposite building can be seen.2.什么是生成式人工智能?
生成式人工智能是指那些能够根据它们所接受的训练, 生成高质量文本、图像和其他内容的深度学习模型软件/平台/系统。
3.什么是ChatGPT?
ChatGPT(Chat Generative Pretrained Transformer,生成式预训练转换器)是美国人工智能实验室OpenAI推出的一种自然语言处理工具,使用Transformer神经网络架构,拥有语言理解和文本生成能力,尤其是它擅长通过连接大量的语料库训练模型。这使得ChatGPT具备上知天文、下知地理,且能根据聊天上下文进行互动表达的能力。
ChatGPT不单是聊天机器人,它有可能在以下方面取代人类劳动:
归纳性的文字工作、代码开发、图像生成、智能客服等。 https://chatgpt.com/4.什么是大语言模型?
大语言模型(Large Language Model,LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。
1.语料库大,以chatGPT3.5为例,语料达8000亿单词,45TB文本。 2.参数量大,1750亿参数(chatGPT3.5)。 3.训练成本高,200~1200万美元/次(chatGPT3),碳排放3.82吨/天。主流模型和产品:
OpenAI的GPT3、GPT3.5、GPT4.0模型和产品ChatGPT。 谷歌公司的LaMDA模型和产品Bard。 百度公司的文心模型和产品文心一言。 北京智谱华章公司的GLM模型和产品智谱清言。 ……5.什么是Sora?
Sora是一个以文本描述生成视频的AI模型,由美国人工智能研究机构OpenAI开发。Sora源于日文そら,音sora,天空之意,寓意无限的创造潜力。 模型的训练数据既包含公开可用的视频,也包括专为训练目的而获授权的著作权视频,但OpenAI没有公开训练数据的数量与确切来源。
OpenAI于2024年2月向公众展示了由Sora生成的多个高清视频,称该模型能够生成长达一分钟的视频。同时也承认该技术的缺陷,包括在模拟复杂物理现象方面的不足。
【Prompt】 Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee (共18词) 两艘海盗船在一杯咖啡中航行时对战的逼真特写视频。
总结
### 文章总结**标题:深入探讨AI领域的关键概念与案例**
**内容概述**:
本文详细介绍了AI(人工智能)领域几个关键概念及其相关案例,包括AIGC(人工智能生成内容)、生成式人工智能、ChatGPT、大语言模型以及最新推出的视频生成模型Sora。
1. **AIGC(人工智能生成内容)**:
- **定义**:AIGC指通过专业的模型和算法,根据用户需求输出各类数字作品(如图片、音乐、文字、语音等)。
- **优势**:相较于传统PGC和UGC模式,AIGC能更精准地满足用户需求,同时内容质量得到算法保障。
- **案例**:Midjourney的“太空歌剧院”画作,通过AI工具生成后获得艺术博览会认可。
2. **生成式人工智能**:
- **定义**:具备从学习数据中生成全新内容的深度学习模型,涵盖文本、图像等多种形式。
- **特点**:能生成高质量内容,是AI技术的重要应用方向。
3. **ChatGPT**:
- **定义**:OpenAI推出的基于Transformer架构的自然语言处理工具,具有强大的语言理解和生成能力。
- **功能与应用**:不仅是聊天机器人,还能胜任文字工作、代码开发、图像生成及智能客服等多种任务。
- **技术优势**:通过大量语料库训练,具备广泛知识和高度互动性。
4. **大语言模型(LLM)**:
- **定义**:使用海量文本数据训练的深度学习模型,专注于自然语言处理和生成。
- **特点**:语料库大、参数量高、训练成本高,是AI领域的核心技术之一。
- **主流模型**:包括OpenAI的GPT系列、谷歌的LaMDA、百度的文心模型等。
5. **Sora视频生成模型**:
- **定义与来源**:OpenAI开发的文本描述生成视频模型,名称寓意无限的创造潜力。
- **技术展示**:能够生成高清且长达一分钟的视频,但在模拟复杂物理现象时存在不足。
- **例子**:成功演示了如“两艘海盗船在咖啡中航行对战”的逼真视频生成。
**总结**:本文从不同角度深入探讨了AI领域的最新成果与应用,展示了AI技术尤其是在内容生成和视频生成方面的强大潜力和前景,同时也揭示了技术发展过程中的挑战与限制。