四个优秀AI Agent开源项目，谈一谈大模型、人工智能代理

什么是AI Agent？

现在我们与大模型的互动，一般的过程是先输入一个提示词，之后，大模型根据输入内容进行计算并响应。每次想要得到一个新的输出，我们就必须再提供一个提示词。这个过程有点麻烦，因为总是要有人来驱动。

AI Agent（人工智能代理）则以不同的方式工作。他们被设计成可独立思考和行动的智能体。我们唯一需要提供的就是一个目标，可以是研究竞争对手分析、写个网站程序或进行一次旅游。AI Agent会生成一个任务列表，然后开始工作，依靠环境的反馈和自己的内心独白。就好像它们可以提示自己似的，在不断发展中适应变化，以最好的方式实现我们制定的目标。

看起来这个过程和自动化流程有点像，但其实有区别。与自动化流程相比，流程是可预知的，用户可以根据数据或系统状态设置一系列的触发器，并配置接下来要执行的活动，然而不同的是，AI Agent可以在存在大量不可预测新信息的环境中工作。这就是AI Agent。

AI Agent有哪些应用场景？

下面是一些应用例子：

在一个有25个AI Agent的虚拟城镇里会发生什么？斯坦福大学和谷歌对此很好奇，所以他们使用OpenAI的API来创建这些虚拟居民，并观察他们如何生活。为了支持这个实验，研究小组创建了一个存储记忆的平台，以及为每个代理提供目的的基本提示。从那时起，人工智能代理能够相互分享信息，记住他们关系的细节，甚至计划情人节派对。
在自动驾驶汽车领域，因为AI控制汽车从A点到B，同时保持在路上并遵守交通规则。根据自动驾驶系统的发展，车辆可以相互合作，并与城市基础设施合作，集成多个智能体的AI系统。
可以在计算机中使用的AI Agent，用于完成各种任务。研究工作的过程其实就是一个适合使用AI Agent的场景。因为Agent可以像人类一样使用笔记本电脑，在互联网上搜索信息，将其保存在数据库和文件中，经过总结分析，将其转化成摘要，最后与你一起验收结果。

可以想象，未来人类的主要活动就是主导战略并与其他人建立关系，而AI Agent则可以自动化其他的工作，甚至也可以与其它Agent进行交互，完成人类的目标。

值得关注的开源AI Agent项目

令人印象深刻的AI Agent有许多，但下面是目前最值得关注的前四个。

1.AutoGen

源码：https://github.com/microsoft/autogen

AutoGen是一个由微软与OpenAI以及宾夕法尼亚州立大学和华盛顿大学的研究人员合作建立的人工智能代理框架。支持多代理对话，以解决用户的任务。

可以使用多个代理来开发LLM应用程序，这些代理可以相互配合以解决任务。AutoGen代理是可定制的，可转换的，并且允许人类参与其中。它们可以在各种模式下运行，这些模式采用LLM，人工输入和工具的组合。

2.AutoGPT

源码：https://github.com/Significant-Gravitas/AutoGPT

AutoGPT是一个使用GPT-4创建的完全自主的AI代理。AutoGPT于2023年3月由首席开发商Toran布鲁斯理查兹首次发布，他也被称为游戏公司Significant Gravitas Ltd.的创始人，该公司生产的电脑游戏带有“道德色彩”，旨在造福和教育全人类。

Auto-GPT是一个实验性的开源应用程序，展示了GPT-4语言模型的功能。这个程序由GPT-4驱动，可以将LLM的“思想”汇聚、连接在一起，以自主实现用户设定的任何目标。

CLI：

$ ./run
Usage: cli.py [OPTIONS] COMMAND [ARGS]...

Options:
  --help  Show this message and exit.

Commands:
  agent      Commands to create, start and stop agents
  arena      Commands to enter the arena
  benchmark  Commands to start the benchmark and list tests and categories
  setup      Installs dependencies needed for your system.

3.BabyAGI

源码：https://github.com/yoheinakajima/babyagi

BabyAGI于2023年3月由Yohei Nakajima发布。与AutoGPT类似，也是使用GPT-4来开发的完全自主的聊天机器人。

该系统使用OpenAI和矢量数据库（如Chroma或Weaviate）来创建、优先处理和执行任务。这个系统背后的主要思想是，它根据先前任务的结果和预定义的目标创建任务。然后，该脚本使用OpenAI的自然语言处理（NLP）功能来创建基于目标的新任务，并使用Chroma/Weaviate来存储和检索上下文的任务结果。

BabyAGI通过运行一个无限循环来工作，该循环执行以下步骤：

从任务列表中提取第一个任务。
将任务发送给执行代理，执行代理使用OpenAI的API根据上下文完成任务。
丰富结果并将其存储在 Chroma或者Weaviate（向量数据库）。
创建新任务并根据目标和上一任务的结果重新确定任务列表的优先级。

4.ChatDev

源码：https://github.com/OpenBMB/ChatDev

ChatDev是一个可以模拟整个软件开发团队的开源对话平台。由OpenBMB开发，OpenBMB是一个旨在为AGI构建基础模型和系统的研究实验室。

ChatDev是一个多代理人的组织结构，以“通过编程彻底改变数字世界”为使命，将代理们团结在一起。ChatDev中的代理通过参加专门的功能研讨会进行协作，完成设计、编码、测试和文档编制等任务。

ChatDev的主要目标是提供一个易于使用，高度可定制和可扩展的框架，该框架基于大型语言模型（LLM），是一个研究集体智慧的理想场景。

ChatDev的功能包括：集成了版本控制的Git、用于交互式参与设计阶段的Human-Agent-Interaction模式，以及用于生成软件中使用到的图像的艺术模式。

关于未来

在新技术发展颠覆的过程中，我们总是能听到一句话：“我们往往太高估短期的作用，低估了未来的影响”。可是AGI这场变革来得太快，以至于我们这种影响和作用在时间上都很是紧迫，甚至有时候有些焦虑。但其实未来已来，唯有积极拥抱。

AI Agent对整个社会能够产生的影响多大，可能不好预测。但可以肯定的是：我们的生活和工作将在这个发展过程中改变。