ChatGPT的出现
2022年11月底,ChatGPT 上线,引爆 AI 圈 和 科技圈,2023年春节后, 人人都开始关注并讨论这项新技术 它是 OpenAI 研发的智能聊天工具, 基于GPT语言模型,模拟人类的对话方式 默认只能用文字进行交互,理解多种语言,有一些插件,可用语音,图表等 截止现在,ChatGPT热度依旧火热,也已被大众所知晓并普遍使用什么是ChatGPT
是一个预训练的对话式的文本生成AI工具 第一个呢是预训练。 第二个是对话式的文本生成 Chat 包括输入端即发出有效提问(Prompt) 和 输出端的智能参考答案 GPT G: Generative, 是一个生成式的模型,可以生成符合语法和语义规则的自然语言的文本, 重点是生成式的模型 P: Pre-trained,基于大规模的文本数据的预训练, 可以使自己更加的聪明。 T: Transformer, 使用 Transformer 的架构来有序的处理文本 GPT不是通过搜索而拼凑答案,而是更像一个大脑 当我们提交完问题之后,GPT会基于它预训练好的能力计算出结果 GPT 是一种语言逻辑推理的大模型也叫 LLM (Large Language Model 大型语言模型) 这个模型是一种神经网络,能够读取,并且理解大量的自然语言的文本,能够像人类一样去驾驭这些语言。 比如我们可以通过中文去和GPT去进行交流。ChatGPT的几种访问方式
1 )访问官网
OpenAI 官方站, https://chat.openai.com 我们如果是调用OpenAI的API, 需要注册官网 注册过程中的技巧和方式,因平台规则限制,在此不详细说明 ?2 )访问聚合网站
POE AI 聚合网站: https://poe.com
聚合了目前最强大的两个对话类的AI工具
只要你能够去访问POE就可以无压力的,随便用是免费,而且稳定的
当然POE的访问也需要去进行一些配置
对于POE,我们可以打开POE的网站来进行一下演示
推荐使用邮箱的方式去进行注册,或者通过google去进行登录就可以了
3 ) 国内镜像
国内镜像: https://github.com/xx025/carrot 或 chat.forefront.ai 访问这个网站 或直接在搜索引擎搜索国内免费ChatGPT镜像 通过以上方式可以找适合自己的ChatGPT工具GPT 和 AIGC 的关系
GPT是具有代表性的大型的语言生成模型之一, 是比较优秀的LLM的实现,也是其技术实现的代表之一 LLM 就是基于大量的训练数据训练的,能够生成高质量的人工语言的神经网络的模型 AIGC 是由人工算法自动生成文本图片等多种类型的数字内容 所以,GPT, LLM, AIGC是紧密相关的 GPT 是 AIGC 重要的组成之一,AIGC采用大模型的技术来生成高质量的文章和其他的内容 通过分析海量的数据,大模型可以自主的去生成文本,实现对AIGC技术的支持 三者相互促进,并推动着彼此的发展ChatGPT的能力
通过先给它提供一个庞大的语料库,让模型通过上千亿个参数,对这些文本去进行标记和学习 最终构建出一个复杂的预测模型,然后根据这个预测模型去生成我们的数据 这种预测的模式跟我们的大脑学习和加工的模式是非常相似的1 ) 拟人化的能力
因为运作模式类似人脑,这也使得GPT能够更加的拟人化, 正是由于它的这种拟人化 能够让它可以像真人一样,和我们正常的聊天,回答各种各样的问题,甚至可以理解人的感情2 )了解全领域的知识
我们发现GPT好像所有的知识它都会, 真正的做到了,上知天文下知地理 我们可以向它来提问各个领域的知识,比如让他帮我们写代码和我们写文档等等。 随着它的模型的迭代,参数的变化,GPT对于整个世界的认知,也将会发生质变 和之前传统的预测模型不一样,它不再是单纯的去记录预训练的这些信息。 同时还会基于预训练的信息去提炼成知识,可以说他有了超越认知的创造力。3 )会表达,具有中立,客观,安全的语言表达能力
同时GPT有中立客观安全的语言表达能力, 当我们询问问题的时候, GPT的回答往往是比较准确和客观的,而且非常具备条理性。 随着GPT的发展,对于一些涉及到不良影响的问题,GPT是拒绝回答的,也就是具备中立和客观的表达的能力。4 )具备复杂的推理能力,可根据上下文语义自行推理
GPT具备复杂的推理能力, GPT3之后的模型泛化出了思维链的能力 这个能力是模型涌现出新能力的关键机制,可以根据上下文的语义去进行自行推理5 )接受身份设定,可以告诉它是谁,特长是什么
GPT接受身份设定的能力,可以不停的告诉GPT它是谁?它的特长是什么? 然后GPT就可以根据我们的设定和提示来帮助我们解决问题 GBT它的这些能力都是以海量的知识和数据作为基础的。 简单点来说,就是将所有的语料送进大语言模型当中,然后让他去预测下一个词汇是什么 与传统的语言模型不同的点在于GPT接收到的语料数据是极其庞大的GPT训练数据的演变
OpenAI 学习资料 参数量 GPT1 5GB 1.17亿 GPT2 40GB 15亿 ChatGPT 45TB+ 1750亿+ 从始至终语言模型,它的训练机制都没有变化, 变的只是模型的量级,俗话说量变引起质变 相较于传统的语言模型呢,GPT就是一个量变引起质变的一个结果
生成大预言模型的过程
第一步是预训练为语言模型灌输知识 第二步是通过模板规范,也就是将人工标注好的这些范例输入到语言模型当中 第三步是创意引导,对GPT生成的结果去进行打标签 基于超大规模的数据,经过这三个步骤造就了今天最强的语言模型ChatGPT类GPT类的产品对当今工作的替代性
1 )容易被GPT取代的工作场景
客服代表,电话销售 语言翻译员,文字工作者 基础数据分析师 普通程序员 普通助理等水平一般的工作人员2 ) 不容易被GPT替代的工作场景
需要判断和决策工作,通过复杂的分析和判断来做出决策的工作 需要创造力和想象力的工作,如艺术家,作家 人际交往和情感互动的工作,如心理治疗师, 临床医生,教育工作者