欢迎关注【AIGC使用教程】 专栏
【AIGC使用教程】SciSpace 论文阅读神器
【AIGC使用教程】Microsoft Edge/Bing Chat 注册使用完全指南
【AIGC使用教程】GitHub Copilot 免费注册及在 VS Code 中的安装使用
【AIGC使用教程】GitHub Copilot 免费注册及在 PyCharm 中的安装使用
【AIGC使用教程】Notion AI 从注册到体验
【AIGC使用教程】AutoGPT 安装使用完全教程
【AIGC使用教程】AutoGPT 安装使用完全教程
1. AutoGPT 介绍 1.1 AutoGPT 简介 1.2 AutoGPT 的工作流程 2. 下载 AutoGPT 项目源码 2.1 GitHub 下载项目源码 2.2 网页下载稳定版源码 3. AutoGPT 安装与使用 3.1 项目安装需求依赖 3.2 安装项目依赖 3.3 环境配置 3.4 添加 OpenAI API-Key 3.5 添加插件(非必需) 4. AutoGPT 使用体验 4.1 使用步骤 4.2 运行 AutoGPT 4.3 实战体验 5. AutoGPT 任务指南 5.1 内容创建 5.2 翻译 5.3 客户服务 5.4 数据分析 5.5 市场研究 5.6 设计网页 5.7 编写代码 5.8 创建应用程序 5.9 在线下单 5.10 博客自动创作 6. 存在的问题自主人工智能来了!AI 自己上网、自己使用第三方工具、自己思考、自己操作你的电脑。 迄今已经在 GitHub 获得了 120K Star。
AutoGPT 是一款基于 GPT-4 的人工智能内容生成机器人,可以通过 LLM 自主产生Prompt,并且通过Google搜索和Python脚本来实现自己的目的。
1. AutoGPT 介绍
1.1 AutoGPT 简介
自主人工智能来了!AI 自己上网、自己使用第三方工具、自己思考、自己操作你的电脑。
Auto GPT 是一个实验性开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4驱动,将LLM“思想”链接在一起,以自主实现您设定的任何目标。作为GPT-4完全自主运行的首批例子之一,Auto GPT突破了人工智能的极限。
项目特点:
🌐 用于搜索和信息收集的互联网接入 💾 长期和短期内存管理 🧠 用于文本生成的GPT-4实例 🔗 访问热门网站和平台 🗃️ 使用 GPT-3.5 进行文件存储和摘要Auto-GPT 是一个能自主迭代、自主迭代(长时记忆)、自我提示且联网查询的新的 GPT 框架,它不需要你与 ChatGPT 在多轮对话中让 ChatGPT 逐步完成你的任务,而是最少只需要在第一轮对话中输入需求,Auto-GPT 就能自己分解任务去完成,且完成度更高。
AutoGPT 的架构基于GPT-4和GPT-3.5,靠API连接;
AutoGPT可以进行自主迭代,即通过自我批判性审查来改进输出、在先前工作的基础上进行构建,并为了获得更准确的结果集成prompt历史记录;
AutoGPT具有内存管理,集成了Pinecone数据库,因此它可进行长期内存存储,保存上下文并基于此进行决策改进。
1.2 AutoGPT 的工作流程
由人类给Auto-GPT分配一个角色(例如一名写手),接着给他分配最多五个任务让他执行。
Auto-GPT就会自己将任务列表拆解成某些具体的任务,并生成后续的任务执行列表。每一步可以是执行Google搜索、生成Python脚本、存储生成文本、执行脚本文件等等。
上述步骤主要依赖于以下几个部件:
基础框架:GPT-4和GPT-3.5,二者分别被成为聪明模型和快速响应模型。这两者共同充当整个Auto-GPT的大脑。不同的任务将会适时的分配给两种不同的模型以加快生成速度和降低成本开销。 自主迭代:从最原始的Task List中出发,将任务投入LLM中生成更进一步细化的Task List。再逐项完成任务并将结果保存。每次结果都会被选择性的放回LLM中再迭代生成回应。 内存管理:Auto-GPT默认使用一种向量数据库(保存在auto-gpt.json中)存储对话上下文,使得LLM可以获得长期记忆并且最大程度降低token(LLM中的数据量计数单位)的使用,防止超过输入限制和降低使用成本。除了本地向量数据库外,还可以使用Redis保存上下文进一步提升性能。 多功能部件:Auto-GPT 被赋予了多种工具,包括本地shell的执行权限、本地文件的读取和写入、Google搜索能力、Python脚本执行能力等等。这些能力不仅仅赋予了 Auto-GPT 的联网能力,还使其拥有了部分本地操作权限,极大拓宽了其能力以及使用范围。
2. 下载 AutoGPT 项目源码
2.1 GitHub 下载项目源码
AutoGPT 项目:【GitHub - AutoGPT】 (https://github.com/Significant-Gravitas/Auto-GPT)(1)点击绿色按键 <>Code
(下图红框 1),打开下拉菜单。
(2)点击粘贴按键(下图红框 2),复制项目克隆地址:https://github.com/Significant-Gravitas/Auto-GPT.git 。
在本地创建一个目录用此法将要克隆的项目,例如
D:\AutoGPT
。
进入创建的文件夹,如下图所示,鼠标右键唤出下拉菜单,选择 Git Bash Here
打开 Git Bush。注意不能从系统菜单或桌面快捷方式直接打开 GitBash。
打开 Git Bush,输入 git clone,粘贴项目克隆的目标地址,如下图所示。
$ git clone https://github.com/Significant-Gravitas/Auto-GPT.git
点击回车后,开始下载项目 AutoGPT,如下图所示。
下载完成后,关闭 Git Bush 窗口。
Auto-GPT 源码就已经下载到创建的文件夹中。
2.2 网页下载稳定版源码
如果没有安装 Git 软件,也可以按如下步骤从网页直接下载稳定版,步骤如下:
打开项目版本网页:【Auto-GPT Releases】 (https://github.com/Significant-Gravitas/Auto-GPT/releases/latest)。
向下滚动页面,找到 “Assets” 的 Source code(zip)
,如下图所示。点击可以直接下载压缩文件 Auto-GPT-0.2.2.zip
。
3. AutoGPT 安装与使用
3.1 项目安装需求依赖
项目需求:
Environment:VSCode + devcontainer,或 Docker,或 Python 3.10 or later for Windows OpenAI API key: 获取地址 (https://platform.openai.com/account/api-keys)可选配置
benckend (pickone): Pinecone, Milvus, Redis, Weaviate ElevenLabs Key: 使用 AI 语音交互。3.2 安装项目依赖
打开命令行编辑器 或 Anaconda Prompt, 建立 AutoGPT 项目虚拟环境,并激活虚拟环境。conda create -n autogpt python==3.8
conda activate autogpt
D:\auto-gpt
。
pip 安装项目依赖(项目依赖文件在源码文件下),如下图所示。
pip install -r requirements.txt
将自动下载安装 Auto-GPT 运行需要的各种第三方库。如果由于某些原因网络不畅(一般会这样),将需要很长时间。这时我们正好可以看看源码文件中的 Readme.md。
3.3 环境配置
在 AutoGPT 文件夹中找到文件 “.env.template”,如果没有请检查是否被设为隐藏文件。
删除 “template” 扩展名,创建一个名为 “.env” 的文件副本。
在文本编辑器中打开 “.env” 文件。
找到写着 OPENAI_API_KEY=
的行。
在 “=” 之后,输入 OpenAI API Key(不带任何引号或空格)。
说明:OpenAI API key: 获取地址 (https://platform.openai.com/account/api-keys)
为您想要使用的服务输入任何其他API密钥或令牌。
保存并关闭“.env”文件。
创建 auto-gpt.json文件,用于存储本地缓存数据(本地记忆),如果存在可忽略。
3.4 添加 OpenAI API-Key
AutoGPT 的架构基于 GPT-4和GPT-3.5,必须设置 OpenAI API-Key。
要将OpenAI API Key用于自动GPT,您需要设置计费(又名付费帐户)。
您可以在上设置付费帐户https://platform.openai.com/account/billing/overview.
(1)访问 OpenAI 官网,注册账户并登录(https://beta.openai.com/signup/)。
(2)在 dashboard 页面,单击 “Create new API key”
(3)输入 API key 名称和用途,单击 “Create”
在 “API keys” 标签下可以找到您的 API-key,将其复制粘贴到 .env 文件中的 OPENAI_API_KEY 字段中。注意 OpenAI API-key 仅在创建时完整显示,一旦丢失不能找回,所以务必保存好。
3.5 添加插件(非必需)
为了扩展或改进 AutoGT 的功能,开发人员最近发布了插件,可让你根据自己的独特需求调整 AutoGPT。插件列表如下:
Twitter plugin
Email plugin
Telegram plugin
Google Analytics plugin
Youtube plugin, and many more.
通过添加插件,AutoGPT 在使用中可以调用 Pinecon-API、Google-API、Eleven Labs API、HuggingFace API,实现各种拓展功能,例如:
支持语音代替文件进行交互,语音服务是由 ElevenLabs 提供。 支持 调用 Stable Diffusion 文生图。 借助 Google APi 和自定义搜索引擎服务。 借助 PINECONE 服务存储缓存,保持与 AutoGPT 之间的交互记录。这些拓展服务需要额外的token 或 key ,不是运行 AutoGPT 的必须配置项,用户可以根据自己的需求和资源情况来设置。 Pinecone API
(1)访问 Pinecone 官方网站,注册账户(https://www.pinecone.io/)。
(2)单击右上角的 “Get started for free” 或 “Sign In” 按钮,登录账户。
(3)进入 Pinecone 控制台(https://console.pinecone.io/)。
(4)在控制台页面的左侧菜单中,单击 “API keys”。
(5)单击 “Create API key” 按钮创建 API key。
创建完成后,新的 API 密钥将显示在列表中。将其复制并粘贴到 .env 文件中的 PINECONE_API_KEY 字段。
(1)访问 Google Cloud 控制台,使用 Google 账户登录。
(2)创建项目:点击控制台左上角的下拉菜单,点击"新建项目",输入项目名称,点击"创建"。
(3)启用 API:在 Google Cloud 控制台中,点击左侧导航栏的 “API和服务” > “库”。搜索并找到您需要的 API(例如谷歌翻译),进入 API 页面,点击"启用"。
(4)创建API密钥:启用 API 以后,点击左侧导航栏的 “API和服务” > “凭据”,点击"创建凭据"后选择 “API密钥”,系统将生成一个新的 API 密钥。
查看 API 密钥,复制并粘贴到 .env 文件中的 GOOGLE_API_KEY 字段中
Eleven Labs API
(1)访问 Eleven Labs 官方网站,注册账户。
(2)登录你的 Eleven Labs 帐户。
(3)点击右上角的用户头像,选择 Profile,找到 API Key 并复制。
查看 API 密钥,复制并粘贴到 .env 文件中的 ELEVENLABS_API_KEY字段中。
HuggingFace API
(1)访问 HuggingFace 官方网站,注册或登陆(https://huggingface.co/)。
(2)点击右上角的用户头像,进入 “settings” 选项。
(3)从左侧列表选择 Access Tokens(https://huggingface.co/settings/tokens)。
(4)选择 “New token”,新建 token,填好后点击 “Generate a token” 生成 token。
将新建的 token 复制并粘贴到 .env
文件中的 HUGGINGFACE_API_TOKEN
字段中,并删除前面的#空格
前缀。
4. AutoGPT 使用体验
4.1 使用步骤
定义 AI 角色
根据你希望 AI 发挥的功能,为其命名和角色,例如“研究人员”、“内容生成器”或“个人编码器”。为了获得更成功的结果,明确你希望人工智能实现的目标。
设定目标
详细概述人工智能的目标,例如获取信息、将数据存储在文件中、执行代码或修改文本。包括要使用的输出文件的信息,以及完成作业所需的任何其他操作。
执行任务
在你一步步完成任务的过程中,对发送的每个人工智能指令给予批准。跟踪人工智能的发展,并根据需要采取适当的行动。在人工智能完成工作并实现其目标后,它将自动关闭。AutoGPT 根据给出的指令给了我以下输出。
4.2 运行 AutoGPT
(1)cmd 进入 autogpt 的根目录,运行 autogpt.py。
python -m autogpt
(2)文件默认的保存目录:..\Auto-GPT\autogpt\auto_gpt_workspace
(3)如果没有 GPT-4 API 权限,可以选择 --gpt3only
调用 ChatGPT3.5 运行。
python -m autogpt --speak --gpt3only
(4)--continuous
可以使AutoGPT一直运行,不用输入y
确认;短命令是 -c
(5)--continuous-limit
接数字,可以指定AutoGPT连续运行的次数;短命令是 -l
(6)按 Ctrl + C
可以退出程序。
(7)卸载程序,直接删除Auto-GPT
安装目录。
4.3 实战体验
我们设计的自动化检索任务时:访问【爱因斯坦Wiki网页】,并进行总结,将总结保存在 Einstein.txt 文件中。【AutoGTP终极教程:安装与使用】,演示视频
输入任务清单如下:
Goal 1: 请阅读这个网页链接的内容 [https://www.wikiwand.com/en/Albert%20Einstein]
Goal 2: 把内容做一个总结
Goal 3: 保存到 “Einstein.txt”
Goal 4: 完成后关机
点击确定,AutoGPT 开始运行。运行过程中会不断询问是否继续,以进入下一个步骤(NEXT ACTION)。
例如:询问是否进行下一个步骤,通过网页浏览器访问指定网页。注意以下提示不是用户输入,而是AutoGPT输出,提示用户进行确认的。
NEXT ACTION: COMMAND = browse_website ARGUMENTS = {‘url’: https://www.wikiwand.com/en/Albert%20Einstein, ‘question’: ‘summary’}
确认进行下一个步骤(NEXT ACTION),AutoGPT 自动打开浏览器页面,读取指定网页,对网页进行分析。
AutoGPT 完成所有设定的任务后,自动退出。
AutoGPT 对爱因斯坦 Wiki 网页的内容总结如上图所示,也保存在 Einstein.txt 文件,位于目录 autogpt\auto_gpt_works_pace\Einstein.txt。
总结内容如下:
The text provides a brief biography of Albert Einstein, including his contributions to the development of both relativity and quantum mechanics, receipt of the Nobel Prize in Physics in 1921 for his work on the photoelectric effect, and attempts to formulate a unified field theory that would include include electromagnetism. It also briefly mentions his philosophical views and opposition to quantum mechanics, as well as his involvement in alerting President Franklin D. Roosevelt of the German nuclear weapons program during World War II. Overall, Einstein is recongnized as one of the greatest and most influential physicists of all time.
中文翻译如下:
本文提供了阿尔伯特·爱因斯坦的简要传记,包括他对相对论和量子力学发展的贡献,1921年因其在光电效应方面的工作而获得诺贝尔物理学奖,并试图制定一个包括电磁学在内的统一场论。它还简要提到了他的哲学观点和对量子力学的反对,以及他在第二次世界大战期间提醒富兰克林·D·罗斯福总统注意德国的核武器计划。总之,爱因斯坦被公认为有史以来最伟大、最有影响力的物理学家之一。
5. AutoGPT 任务指南
Auto GPT 可以用于各种任务,本节简单介绍 Auto GPT 可以执行的一些功能,以及它是如何自动执行这些功能的。
参考资料: Explained: Best AutoGPT Examples And Use Cases - Dataconomy
5.1 内容创建
网站、博客和社交媒体帖子的内容可以使用 Auto GPT 创建。如果你给它一个主题或一套指导方针,Auto GPT 可以产生高质量、相关性和趣味性的材料。
Auto-GPT的长期记忆功能帮助了Auto-GPT可以始终保持在相同的背景设定里而不偏离。虽然没有完成整篇文章,但是故事脉络已经非常清晰,甚至已经可以说是在“创作”一些新文字。
5.2 翻译
你可以使用 Auto GPT 执行翻译任务。通过使用 Auto GPT 以一种语言作为输入文本,可以将文本翻译成另一种语言。在不同国家/地区开展业务并需要快速文档或通信翻译的企业可以提供非常大帮助。
5.3 客户服务
客户支持职责,如响应频繁的查询和解决问题,可以通过 Auto GPT 实现自动化。Auto GPT 可以使用自然语言处理来理解客户查询并提供相关的解决方案。
5.4 数据分析
可以使用 Auto GPT 执行数据分析活动。数据输入允许 Auto GPT 分析信息并产生可用于决策的见解。
5.5 市场研究
AutoGPT可以帮助您进行研究,让您定义研究主题、范围和目标,然后自动创建和执行实现目标所需的所有必要任务。这是目前最有用的AutoGPT示例之一。例如,你可以告诉AutoGPT研究2022年最成功的科幻小说,对它们进行总结,将摘要保存到文件中,并通过电子邮件发送给你。AutoGPT将使用GPT-4和GPT-3.5浏览网页、读取和写入文件、查看其提示的结果,并将其与提示历史记录相结合。
AutoGPT还可以通过提高生产力和效率来帮助您进行研究。让AutoGPT处理研究中繁琐和重复的方面,例如寻找来源、提取信息、格式化引文和检查抄袭,可以节省时间和精力。您还可以从AutoGPT的自我改进能力中受益,并从自己的输出和反馈中学习。AutoGPT可以根据您的偏好和目标优化其提示和输出。
企业和研究人员可以使用 Auto GPT 根据数据输入生成报告。通过输入数据,Auto GPT可以分析信息并产生准确和有指导意义的结果。
Auto-GPT 是营销专业用户的绝佳工具。例如,推特用户 Sully Omarr 展示了创建防水鞋可能性的市场概览任务。Auto-GPT 列出了该领域的前五名制造商。Auto-GPT还可以从大量评论中提取优缺点。
Auto GPT 输出的结果如下。
5.6 设计网页
Auto-GPT 的一个用例是创建网站。
这在 GPT-3.5 或 GPT-4 也可以完成,但使用 Auto-GPT 能够通过单个提示执行更复杂的任务。Auto-GPT 会在网上自行搜索源代码和示例代码,并在开发过程中使用它们。
5.7 编写代码
Auto GPT 可用于编码作业生成完整的程序或代码片段。Auto GPT 可以通过考虑编程参数或需求来生成有效且高效的代码。需要精确快速地编写代码的开发人员会发现这种功能非常有帮助。
AutoGPT是一个自主的人工智能程序,可以通过分配角色和目标并使用其功能来帮助您编写代码。它是通过基于web的界面访问的,该界面允许您查看程序生成的数据和报告。这是目前最好的AutoGPT示例之一。
如您所知,AutoGPT通过API使用GPT-4和GPT-3.5,通过在自己的提示上迭代并在每次迭代中基于它们来创建完整的项目。它可以读取和写入文件,浏览网页,查看提示的结果,并将其与提示历史记录相结合。例如,您可以告诉AutoGPT您希望的最终目标是什么,例如“开发一个允许用户与ChatGPT聊天的web应用程序”,应用程序将自行生成完成任务所需的每个提示,例如“为前端创建HTML文件”、“为后端编写Python脚本”、“连接到ChatGPT-API”等。你也可以在生成提示时对其进行监控和修改,推特用户Significant Gravitas证明了这一点。
示例代码是用一个简单的错误编写的,任何人都可以在几分钟内解决这个错误。相比之下,人工智能采用了一种算法方法,在不到一分钟的时间内完成了代码修复。
5.8 创建应用程序
AutoGPT 可以使用您的关键字根据您的规范生成代码片段甚至整个程序。例如,如果你给它关键字“天气”和“应用程序”,它可能会创建一个显示当前天气和你所在位置预报的应用程序。这是最热门的AutoGPT示例之一。
如果AutoGPT如此擅长编码,为什么不开发一个应用程序呢?Varun Mayya也有同样的想法,并决定用AutoGPT开发一款应用程序。
人工智能意识到他缺乏完成任务所需的组件,特别是Node.js的运行时环境。节点安装不是一个简单的操作,但AutoGPT让它变得无痛。
它查找了如何设置环境,获取了存档,然后启动了Node服务器以开始工作。
5.9 在线下单
AutoGPT可以帮助您完成的任务之一是点披萨。这是最有趣的AutoGPT示例之一。要使用AutoGPT订购披萨,您需要定义自己的角色和目标。例如,你的角色可能是“披萨爱好者”,你的目标可能是“在我附近找到最好的披萨店”、“点一个加奶酪的大意大利辣香肠披萨”和“用信用卡付款”。然后,AutoGPT将使用其互联网访问、内存管理和文本生成功能执行以下步骤:
搜索你所在地附近的披萨店,比较它们的评分、价格和评论。
根据您的喜好和供应情况选择最佳披萨店。
打电话或访问披萨店的网站,使用自然语言下单。
确认您的订单详细信息、交货地址和付款方式。
等待你的披萨到达,尽情享受吧!
AutoGPT还可以处理过程中可能出现的任何问题或更改,例如取消或修改订单、跟踪交货状态或联系客户服务。AutoGPT还可以从您的反馈和偏好中学习,以提高其性能和对未来订单的满意度。
5.10 博客自动创作
如果你是一名播客用户或有志成为播客用户,你可能想知道如何为观众创造引人入胜的高质量内容。这是最好的AutoGPT示例之一。播客的挑战之一是制作原创和相关的脚本,吸引听众的注意力和兴趣。这就是AutoGPT可以帮助您的地方。
您可以使用AutoGPT来准备播客,方法是提供一些与您的主题相关的关键词,并选择适合您的风格和目的的特征。然后,Autogpt将生成一段文本,您可以将其用作播客的脚本或灵感来源。
例如,如果你想准备一个关于AutoGPT如何帮助你准备播客的播客,你可以使用以下关键词:“AutoGPT可以如何帮助你筹备播客。”你也可以选择专业的语气、长度和段落格式。然后,Autogpt将生成如下内容:
“播客是一种流行而有效的方式,可以与广大观众分享你的想法、观点和故事。然而,播客也需要大量的创造力、研究和计划来制作引人入胜的高质量内容。如果你正在寻找一种简化和改进播客流程的方法,你可能想尝试自动签名。
Autogpt是一种创新工具,可以根据您的关键词和偏好生成文本。你可以使用autopt来准备播客,给它一些与你的主题相关的关键词,并选择适合你的风格和目的的语气、长度和格式。然后,Autogpt将生成一段文本,您可以将其用作播客的脚本或灵感来源。
使用autopt可以帮助您节省准备播客的时间和精力。你不必花几个小时集思广益、研究和写剧本。你可以让autopt为你做这项工作,然后根据你的意愿编辑或调整生成的文本。您还可以使用autopt来探索主题的不同角度和视角,并生成更多样化和原创的内容。
Autogpt还可以帮助你提高你的播客技巧和信心。通过阅读和聆听生成的文本,你可以学习与主题相关的新词汇、表达方式和信息。您也可以按照生成的脚本或将其用作指南来练习发音、语调和表达。您还可以从观众那里获得反馈,说明他们喜欢生成的内容,以及他们希望从您那里听到更多内容。
Autogpt是一个可以帮助您以快速、简单和有趣的方式准备播客的工具。你可以使用它根据你的关键词和偏好生成文本,然后将其用作播客的脚本或灵感来源。你也可以用它来学习新东西,提高你的技能,并与你的观众互动。Autogpt是一个可以帮助您释放播客潜力的工具。”
Autogpt是一个可以帮助你像专业人士一样准备播客的工具。
6. 存在的问题
成本很高。Auto-GPT 是基于 GPT-3.5/GPT-4 建立的,需要从 OpenAI 购买 token。
如果一次任务需要 50个 step,每个 step 花费 2K tokens 的 GPT-4 使用量,Prompt(提示词)和Completion(回答)的价格是每 1K tokens 是 0.05 美元,成本就是50*2*0.05*7=352元人民币。
存在死循环在执行任务的时候,Auto-GPT 会将任务细化并分解。但是如果遇到 GPT-4 无法处理的问题,就会陷入自我循环,每个 step 执行完后的动作都是 “do_nothing”,下一个动作继续执行该动作,陷入死循环。
执行速度过慢GPT-4 生成 token 的速度就比较慢,再加上脚本执行其它指令,整个任务花费的时间就更长。
参考资料:
【Explained: Best AutoGPT Examples And Use Cases - Dataconomy】
【AutoGTP终极教程:安装与使用】,演示视频
版权声明:
欢迎关注【AIGC使用教程】原创作品
转发请注明原文链接:【AIGC使用教程】AutoGPT 安装使用完全教程(https://blog.csdn.net/youcans/article/details/130455816)
Copyright 2023 youcans, XUPT
Crated:2023-05-01