AIGC辅助办公 - 人工智能

1.什么是AIGC？

早期内容生成方式为专业(人士)生成内容(Professional Generated Content，PGC)。

如：音乐专业人士的创作、设计师的平面设计创作

用户生成内容(User Generated Content，UGC)更倾向于指向一种商业运营模式，这种模式下，平台的内容由众多用户贡献，相对于PGC：

缺点是，作品质量参差不齐，一部分甚至有粗制滥造。优点是，激发了广大用户(非专业人士)的创造力，产生了绝对数量远超PGC的内容，内容形态更加丰富多元。大数据遴选推荐算法会将优质产品筛选出来，用户的行为构成了庞大的表决机制。 AIGC(AI Generated Content，人工智能生成内容)是指由专业的模型和算法根据用户需求输出符合需求的数字作品，形态包括：图片、音乐、文字和语音等。

案例：Midjourney的“太空歌剧院”画作

太空歌剧院是游戏设计师杰森·艾伦使用AI绘图工具Midjourney生成，再经Photoshop润色而来。 https://www.midjourney.com 2022年8月，美国科罗拉多州举办艺术博览会，“太空歌剧院”获得数字艺术类别冠军。

Midjourney绘画展示

10-20-30-40岁招手的中国女性

Prompt(提示词)：A pair of young Chinese lovers，wearing jackets and jeans，sitting on the roof，the background is Beijing in the 1990s，and the opposite building can be seen.

2.什么是生成式人工智能？

生成式人工智能是指那些能够根据它们所接受的训练，生成高质量文本、图像和其他内容的深度学习模型软件/平台/系统。

3.什么是ChatGPT?

ChatGPT(Chat Generative Pretrained Transformer，生成式预训练转换器)是美国人工智能实验室OpenAI推出的一种自然语言处理工具，使用Transformer神经网络架构，拥有语言理解和文本生成能力，尤其是它擅长通过连接大量的语料库训练模型。这使得ChatGPT具备上知天文、下知地理，且能根据聊天上下文进行互动表达的能力。

ChatGPT不单是聊天机器人，它有可能在以下方面取代人类劳动：

归纳性的文字工作、代码开发、图像生成、智能客服等。 https://chatgpt.com/

4.什么是大语言模型？

大语言模型(Large Language Model，LLM)是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。

1.语料库大，以chatGPT3.5为例，语料达8000亿单词，45TB文本。 2.参数量大，1750亿参数(chatGPT3.5)。 3.训练成本高，200~1200万美元/次(chatGPT3)，碳排放3.82吨/天。

主流模型和产品：

OpenAI的GPT3、GPT3.5、GPT4.0模型和产品ChatGPT。谷歌公司的LaMDA模型和产品Bard。百度公司的文心模型和产品文心一言。北京智谱华章公司的GLM模型和产品智谱清言。 ……

5.什么是Sora？

Sora是一个以文本描述生成视频的AI模型，由美国人工智能研究机构OpenAI开发。Sora源于日文そら，音sora，天空之意，寓意无限的创造潜力。模型的训练数据既包含公开可用的视频，也包括专为训练目的而获授权的著作权视频，但OpenAI没有公开训练数据的数量与确切来源。

OpenAI于2024年2月向公众展示了由Sora生成的多个高清视频，称该模型能够生成长达一分钟的视频。同时也承认该技术的缺陷，包括在模拟复杂物理现象方面的不足。

【Prompt】 Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee (共18词) 两艘海盗船在一杯咖啡中航行时对战的逼真特写视频。

总结

### 文章总结
**标题：深入探讨AI领域的关键概念与案例**
**内容概述**：
本文详细介绍了AI（人工智能）领域几个关键概念及其相关案例，包括AIGC（人工智能生成内容）、生成式人工智能、ChatGPT、大语言模型以及最新推出的视频生成模型Sora。
1. **AIGC（人工智能生成内容）**:
- **定义**：AIGC指通过专业的模型和算法，根据用户需求输出各类数字作品（如图片、音乐、文字、语音等）。
- **优势**：相较于传统PGC和UGC模式，AIGC能更精准地满足用户需求，同时内容质量得到算法保障。
- **案例**：Midjourney的“太空歌剧院”画作，通过AI工具生成后获得艺术博览会认可。
2. **生成式人工智能**:
- **定义**：具备从学习数据中生成全新内容的深度学习模型，涵盖文本、图像等多种形式。
- **特点**：能生成高质量内容，是AI技术的重要应用方向。
3. **ChatGPT**:
- **定义**：OpenAI推出的基于Transformer架构的自然语言处理工具，具有强大的语言理解和生成能力。
- **功能与应用**：不仅是聊天机器人，还能胜任文字工作、代码开发、图像生成及智能客服等多种任务。
- **技术优势**：通过大量语料库训练，具备广泛知识和高度互动性。
4. **大语言模型（LLM）**:
- **定义**：使用海量文本数据训练的深度学习模型，专注于自然语言处理和生成。
- **特点**：语料库大、参数量高、训练成本高，是AI领域的核心技术之一。
- **主流模型**：包括OpenAI的GPT系列、谷歌的LaMDA、百度的文心模型等。
5. **Sora视频生成模型**:
- **定义与来源**：OpenAI开发的文本描述生成视频模型，名称寓意无限的创造潜力。
- **技术展示**：能够生成高清且长达一分钟的视频，但在模拟复杂物理现象时存在不足。
- **例子**：成功演示了如“两艘海盗船在咖啡中航行对战”的逼真视频生成。
**总结**：本文从不同角度深入探讨了AI领域的最新成果与应用，展示了AI技术尤其是在内容生成和视频生成方面的强大潜力和前景，同时也揭示了技术发展过程中的挑战与限制。