大家好,我是老渡。
昨天在公司听了清华大学智能产业研究院现场分享的AI医院小镇。
图片
这是一个虚拟世界,所有的医生、护士、患者都是由LLM驱动的Agent智能体,可以自主交互。它们模拟了整个诊病看病的过程,在涵盖主要呼吸道疾病的MedQA数据集子集上,实现高达93.06%的最新准确率。
一个优秀的智能体,离不开优秀的设计模式。看完这个案例,我赶紧拜读了吴恩达老师最近发表的 4 种主要的Agent设计模式。
吴恩达是人工智能和机器学习领域国际上最权威的学者之一
然后,赶紧整理出来,跟大家分享一下。
模式一、反思(Reflection)
在这个模式里大模型第一次生成的结果并不直接输出,而是把结果重新丢给大模型让其检查、评估。
它会得出第二版本的结果,而这个版本的结果可能比第一版本工作得更好。
用孔子的话说这叫“吾日三省吾身”。
在这个模式里编写的具体Prompt可以运用我们之前分享几个推理模式,如:少样本(Few-shot)、思维链(CoT)、思维树(ToT)、ReAct等等。
这一模式的核心目的是,在不借助外力的情况下,将大模型的推理能力尽可能发挥到极致。
模式二、工具使用(Tool Use)
这一模式是让智能体能够利用外部工具执行特定的任务。
说白了就是“摇人,专业事交给专业人”。
大模型本质是文本预测,并没有算数、执行代码等能力。遇到这些任务,我们可以让大模型生成式子、代码,然后调用计算器、代码解释器来完成。
这个模式的Agent有了外力的帮助,似乎可以变得更强大了。
模式三、规划(Planning)
这种模式是让智能体将一个复杂任务分解成一系列简单的小任务,然后逐一解决。
其实就是“要把大象放冰箱,拢共分几步”,刚听到这个问题是一脸懵逼,但当看到下图的时候,一下子就豁然开朗了。
图片
模式四、多智能体协作(Multiagent Collaboration)
上一个模式的Agent将复杂任务拆解之后,自然而然就需要多个Agent各司其职,相互协作,共同完成复杂的任务。
图片
之前我们分享过一个开源AI程序员GPT Pilot,他的设计思路就是多Agent模式,模拟了产品经理、架构师、程序员、测试各种角色,完成软件开发任务。
文章开头介绍的AI医院小镇也是这个模式,后续我也会分享这个模式的实践案例。