Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - AI Agents ,本文将继续聚焦在针对新型开源 AI Agents CrewAI 的技术进行解析,使得大家能够了解 CrewAI 的基本概念以及基于 CrewAI 对其进行应用及市场开发。
LLM (大型语言模型) 已经渗透到我们生活的方方面面,从日常聊天到文档解析,发挥着重要作用。随着 LLM 在全球范围内的热潮席卷而来,开发者们开始将重点放在人类推理和问题解决上,创造了更加专注和目标导向的 LLL(Language and Logic Learning)应用程序,以应对当今面临的各种复杂问题。
这些创新的 LLL 应用程序通过优化、扩展和提升 LLM 的能力,为我们提供了更加高效、智能化的解决方案。不论是在商业、科学还是社会领域,这些应用程序都成为了我们理解和应对复杂问题的有力工具,同时也开辟了全新的可能性。
一、传统 AI Agents 的出路在哪里 ?
随着技术的蓬勃发展,AI Agents 正在成为改变游戏规则的力量,迅速成为解决问题、创造力和创新的合作伙伴,而这正是 CrewAI 的独特之处。
能想象一下?仅仅几分钟内,可以将一个想法转化为一个完整的登录页面,这正是我们利用 CrewAI 一起实现的场景。
最近的一个案例展示了 CrewAI 与 LangChain 和 OpenHermes2.5(由 Ollama 提供支持)合作的成果,将一行简单的文字转变为一个完整的登录页面。这个案例揭示了 AI Agents 协作中尚未开发的巨大潜力,以及更快速进行市场测试想法的能力,而这只是 CrewAI 在 Replit 中使用代码的一个应用场景。
如下为将 Ollama 与 CrewAI 集成 Demo 示例:
from langchain.llms import Ollama
ollama_openhermes = Ollama(model="agent")
# Pass Ollama Model to Agents: When creating your agents within the CrewAI framework, you can pass the Ollama model as an argument to the Agent constructor. For instance:
local_expert = Agent(
role='Local Expert at this city',
goal='Provide the BEST insights about the selected city',
backstory="""A knowledgeable local guide with extensive information
about the city, it's attractions and customs""",
tools=[
SearchTools.search_internet,
BrowserTools.scrape_and_summarize_website,
],
llm=ollama_openhermes, # Ollama model passed here
verbose=True
)
实例化 Ollama 模型
CrewAI 的愿景非常明确,即让工程师们能够借助 AI Agents 的集体力量,超越传统的自动化方法。CrewAI 将各种代理聚集在一起,简化决策过程,增强创造力,并迎接解决复杂挑战的挑战。
这种新型协作方式不仅提供了高效的工具和技术支持,而且还鼓励创新和实验。CrewAI 的出现为工程师们创造了一个全新的机遇,使他们能够更快速地推动想法的实现,并在竞争激烈的市场中保持领先地位。
二、什么是 CrewAI 库 ?
由 OpenAI 开发,于 2023 年 8 月发布。CrewAI 提供了一组通用的工具和库,可用于处理多代理系统的常见任务,如代理通信、协调和决策。CrewAI 的潜在应用包括机器人协作、自动驾驶、虚拟现实以及增强现实等多种不同领域。
作为一个专为构建和编排 AI Agents 组而设计的库。CrewAI 基于简单化理念以及模块化策略的模式,使得我们可以将 CrewAI 集成到我们的项目中变得轻而易举。我们可以这样理解:将 CrewAI 想象成一组构建块,每个构建块都是独一无二的,但它们都经过精心设计,可以无缝组合在一起。
从技术实现角度而言,CrewAI 建立在 LangChain 之上,这使得它能够与多种不同的现有工具兼容,包括通过 Ollama 等平台的本地开源模型。
通过借助 CrewAI,我们可以轻松构建一个强大的 AI Agents 组,以解决各种复杂任务和挑战。无论是自然语言处理、问题解答还是智能决策,CrewAI 提供了丰富的功能和灵活性。我们可以根据具体需求自由选择和组合各种模块,以创建一个符合我们预期目标的独特系统。
借助 CrewAI 的模块化设计,我们可以将现有的工具和技术与其无缝集成,实现更高效的开发和部署。基于所提供的简单易用接口和开发人员友好的文档,使得我们能够快速上手并快速实现我们的创意。
不仅如此,CrewAI 同时也是一个持续发展和更新的库,积极采纳并融合最新的研究成果和技术进展。这意味着我们可以始终与前沿的人工智能能力和最佳实践保持同步。
三、CrewAI 架构设计及实现原理
类似于 LangChain 的设计理念,CrewAI 的设计思想是让工程师们能够以简单的方式构建复杂的 AI 应用。通过模块化的方法,将功能划分为独立的构建块,每个构建块都具有特定的功能和任务。这种模块化的设计思维使得工程师们可以根据需要自由选择、组合和定制这些构建块,从而快速搭建出符合自己需求的系统。
通常来说,CrewAI 的核心组件主要涉及如下:
1、Agent - 代理
Agent 通常为我们忠诚而值得信赖的伙伴,每个 Agent 都有自己独特的个性、背景故事和技能。他们能够随时准备被协调支配,无论是去实现某一特定的功能场景、解决棘手的难题,还是探索未知的世界。
2、Task - 任务
CrewAI 任务是为了解决特定问题或完成特定目标而设计的。每个任务都具有明确的目标和要求,并且被分解成小而专注的子任务。这种任务的细分使得 Agent 能够更加集中精力,并以更高效的方式完成任务。
每个 CrewAI 任务都具有独特的特征和要求,Agent 需要根据任务的性质和目标来选择合适的方法和策略。这使得任务的执行更加灵活和自适应,Agent 可以根据具体情况做出相应的决策和调整。
3、Tools - 工具
在 CrewAI 中,Agent 被用作高效执行任务的工具。我们可以利用 LangChain 中的各种现有工具,也可以快速开发自己的工具。同时,CrewAI 也鼓励我们根据具体任务的需求,快速编写自定义工具。这种灵活性使得我们能够根据特定情况和任务的要求,定制化代理工具,以更好地满足我们的需求。
通过结合使用 LangChain 中的现有工具和自定义工具,我们能够最大程度地发挥代理的潜力,提高任务执行的效率和质量。
4、Process - 流程
Process 是根据任务的性质和复杂程度进行定制的。不同的任务可能需要不同的 Process 来达到最佳效果。Process 可以包括任务的分解、资源的分配、沟通协调等环节,旨在最大限度地提高团队的工作效率和任务完成质量。
Process 的设计也可以根据经验和实践进行不断优化和改进。通过对 Process 的不断迭代和优化,团队可以提高工作效率、减少错误和风险,并提供更好的团队协作和成果交付。
5、Crew - 执行者
Crew 在 CrewAI 中是代理人、任务和过程相结合的容器层,是任务执行的实际场所。作为一个协同合作的环境,Crew 提供了代理人之间的交流、合作和按照规定过程执行任务的平台。通过 Crew 的设计,代理人能够更好地协作并以高效的方式完成任务。
从架构设计角度而言,经过 ReActSingleInputOutputParser 增强,每个 CrewAI Agent 本质上都是一个 LangChain Agent。该解析器经过专门修改,以便更好地进行功能支持,包含用于上下文焦点的绑定停用词,并集成了内存机制(使用 LangChain 的 ConversationSummaryMemory)以实现任务的连续性。
Agent 是建立在 LangChain 之上的,这一事实创造了飞轮效应,主要的一个是我们可以立即使用所有 LangChain 工具和工具包,从而使得 CrewAI 具有很强的可扩展性和灵活性,可用于各种任务。
在当前的迭代中,Agent 自主运行,通过自我对话来确定工具的使用。这使得其能够适应不断变化的环境和任务要求。然而,CrewAI 的未来版本计划引入不同的流程类型。这些将允许代理在更复杂的场景中协同工作,例如在团队合作任务或需要多个代理来解决单个问题的情况下。
在最新版本的 CrewAI 平台中,每个 Task 在创建时都将明确分配至指定的代理单元来执行。这有助于更清晰识别每个代理当前负责的任务类型与量,以及任务运行进度。
同时,系统还能针对每个 Task 限定其使用的工具范围,例如仅允许调用某类算法库等,从而可以有效避免由于工具限制导致的任务失败,也防止单个代理长期占用特定资源阻塞其他工作。
Crew 作为封装代理和任务的框架,促进它们顺序执行工作,从而使得更容易管理代理之间的依赖关系,并确保任务以正确的顺序执行。在业务实践中,我们可能会发现部署多个独立的 Crew(每个 Crew 配备几个特工)更为有效。这种模块化方法允许每个工作人员产生不同的结果,而不是由单个大型工作人员处理许多任务和代理处理单一输出。
四、CrewAI 与 Autogen 以及 ChatDev Agents 的对比分析
Autogen 擅长创建能够协同工作的会话代理,但其缺点是缺乏固有的流程概念。这意味着在 Autogen 中,编排代理的交互需要额外的编程。随着任务规模的增长,这可能会变得复杂和繁琐。
相对于 CrewAI, 具体来说,Autogen 在以下方面存在缺陷:
- 缺乏流程概念:这意味着 Autogen 代理只能按照它们被编程的方式进行交互。如果需要代理以不同的方式交互,则需要进行额外的编程。
- 编程复杂:编程 Autogen 代理的交互可能非常复杂,尤其是对于复杂的任务及逻辑。
- 可扩展性差:Autogen 代理的编程方式不利于可扩展性。随着任务规模的增长,编程代理的交互变得更加困难。
ChatDev 将流程的概念引入了 AI 代理领域,但其实现相当僵化。ChatDev 中的自定义是有限的,并且不适合生产环境。这意味着 ChatDev 可能难以满足复杂应用程序的需求,并且可能导致可扩展性和灵活性问题。
同样,相对于 CrewAI,ChatDev 的不足主要体在以下几个方面,具体:
- 自定义有限:ChatDev 中的自定义是有限的。这意味着 ChatDev 可能难以满足复杂应用程序的需求。
- 不适合生产环境:ChatDev 不适合生产环境。这意味着 ChatDev 可能难以满足实际应用程序的要求。
- 可扩展性差:ChatDev 的实现不利于可扩展性。随着任务规模的增长,ChatDev 可能难以满足应用程序的需求。
总的来说,相对于 Autogen 和 ChatDev 创建会话代理的工具,CrewAI 的构建以生产为中心,既提供了Autogen 对话代理的灵活性,又采用了 ChatDev 的结构化流程方法,但又不失灵活性。
CrewAI 基于动态的流程设计理念,具有很强的适应性,可以无缝地融入开发和生产工作流程,以使得工作流程可以根据需求进行调整和优化,以适应不同的工作场景和业务需求。
未来,CrewAI 将继续丰富其工作流程能力,支持涵盖更多领域的流程定义。同时,CrewAI 平台将进一步优化不同助手间的协作体系,提高工作效率和质量。
与此同时,CrewAI 在用户体验和定制性方面也在不断改进。基于简单直观的集成接口,可以有效地帮助企业快速定义和执行定制化的工作流,用户无需关注底层技术细节,便可安全有效地利用 AI 助手团队。
因此,从某种意义上来讲,CrewAI 不仅是一个解决人工智能协同问题的有效工具,同时,也在重新塑造人类与 AI 之间的关系模式。它将 AI 助手的能力发挥到极致,助推 AI 在各行各业的广泛应用。随着 CrewAI 技术的不断成熟,AI 将成为企业协同工作的重要力量。
Reference :[1] https://github.com/joaomdmoura/crewai