前言
截止到目前,我们已经从大模型的定义概念,应用层涉及的一些概念做了些了解。在大模型的应用开发中,RAG、Agent等概念我们之前也做了些简述,没有看过的可以粗略回顾一下:[大模型06-大模型应用开发之准备篇。
本文我们重点讲的就是伴随着大模型的广泛应用,这些概念是在什么体系和场景下衍生的;换句话说,基于LLM,目前大家在做的应用,他主流的业务架构和技术架构都是什么样子的,我们在了解之后,可以根据依据我们现实的业务需求,来选择自己的技术路线。
【一一AGI大模型学习 所有资源获取处一一】
①人工智能/大模型学习路线
②AI产品经理入门指南
③大模型方向必读书籍PDF版
④超详细海量大模型实战项目
⑤LLM大模型系统学习教程
⑥640套-AI大模型报告合集
⑦从0-1入门大模型教程视频
⑧AGI大模型技术公开课名额
技术往往一半是基础设施,一半是应用设施
就像我们的软件开发,一半是做中间件,框架等基础层的,另一半是在基础层之上,来开发应用的。
大模型目前也是,目前技术分为两个方面:
建设和训练基础大模型 建造大模型应用,或者基于基础大模型的应用开发同时,基础大模型的建设和训练,又需要更为复杂、丰富和专业的知识,这部分长期看来,不会需要太多的人;我们绝大多数人,都会在大模型的应用层这一层,而像我在01篇写到的:
我们在不断被迫接受着过量的信息和超出认知的技术革新,否则就会处于被革新的尴尬境地。
我们大部分人或者所有人都需要接触和掌握的。
典型的业务架构
目前在实际落地场景中,广泛在用的或者是不断迭代演进的,基本都是围绕这三种类型来的:
AI Embedded模式
这个场景,很好理解,就是在我们的传统应用中,其中某个环节加入了LLM的能力来帮我们提效做一些事情。
AI Copilot模式
这种模式,是在我们的系统应用中,广泛的应用LLM的能力,再通过我们的应用进行串联,这也是目前使用最多的模式。 我们目前能看到各种各样的Copilot,Microsoft Copilot,GitHub Copilot等等。
在这些场景中,大家并不会依赖算法的结果进行最终决策,大都是作为一种信息的收集来源和参考。对比传统的搜索引擎,更多的是效率上的提升,形态其实没有发生本质变化。
AI Agent模式
这个我们可以看到,明显与前两种模式不同,前两种模式的任务主要还是以人来实现为主,LLM作为辅助。
而Agent模式,人只需要提出要求和指令,AI可以自动帮助拆解任务,完成任务的执行。
单Agent和Multi-Agent
我们之前说,在大模型领域,大模型替代了传统agent 中的规则引擎以及知识库,Agent提供了并寻求推理、观察、批评和验证的对话通道。
而Multi-Agent(多智能体系统) 是指由多个自主个体组成的群体系统,其目标是通过个体间的相互信息通信和交互作用。
在基于大模型的应用领域中,当复杂任务被分解成更简单的子任务时,LLM已经被证明了拥有解决复杂任务的能力。Multi-Agent 的通信与协作可以通过“对话”这一直观的方式实现这种子任务的分拆和集成。
为了使基于大模型的Agent适合于Multi-Agent的对话,每个Agent都可以进行对话,它们可以接收、响应和响应消息。当配置正确时 ,Agent可以自动与其他代理进行多次对话,或者在某些对话轮次中请求人工输入,从而通过人工反馈形成RLHF。可对话的Agent设计利用了LLM通过聊天获取反馈并取得进展的强大能力,还允许以模块化的方式组合LLM的功能。
基于大模型的常见单Agent 系统包括:
AutoGPT:AutoGPT是一个AI代理的开源实现,它试图自动实现一个给定的目标。它遵循单Agent范式,使用了许多有用的工具来增强AI模型,并且不支持Multi-Agent协作。
ChatGPT+ (code interpreter or plugin) :ChatGPT是一种会话AI Agent,现在可以与code interpreter或插件一起使用。code interpreter使ChatGPT能够执行代码,而插件通过管理工具增强了ChatGPT。
LangChain Agent:LangChain是开发基于LLM应用的通用框架。LangChain有各种类型的代理,ReAct Agent是其中一个著名的示例。LangChain所有代理都遵循单Agent范式,并不是天生为交流和协作模式而设计的。
Transformers Agent:Transformers Agent 是一个建立在Transformer存储库上的实验性自然语言API。它包括一组经过策划的工具和一个用来解释自然语言和使用这些工具的Agent。与 AutoGPT类似,它遵循单Agent范式,不支持Agent间的协作。
基于大模型的常见Multi-Agent 系统包括:
BabyAGI:BabyAGI 是一个用Python脚本实现的人工智能任务管理系统的示例。在这个已实现的系统中,使用了多个基于LLM的代理。例如,有一个Agent用于基于上一个任务的目标和结果创建新任务,有一个Agent用于确定任务列表的优先级,还有一个用于完成任务/子任务的Agent。BabyAGI作为一个Multi-Agent系统,采用静态Agent对话模式,一个预定义的Agent通信顺序。
CAMEL:CAMEL 是一个agent 通信框架。它演示了如何使用角色扮演来让聊天Agent相互通信以完成任务。它还记录了Agent的对话, 以进行行为分析和能力理解,并采用初始提 示技术来实现代理之间的自主合作。但是,CAMEL本身不支持工具的使用,比如代码执行。虽然它被提议作为多代理会话的基础设施,但它只支持静态会话模式。
Multi-Agent Debate:Multi-Agent Debate试图构建具有多代理对话的LLM应用程序,是鼓励LLM中发散思维的有效方式,并改善了LLM的事实性和推理。在这两种工作中 ,多个LLM推理实例被构建为多个Agent来解决与Agent争论的问题。每个Agent都是一个LLM推理实例,而不涉及任何工具或人员,并且Agent间的对话需要遵循预定义的顺序。
MetaGPT:MetaGPT 是一种基于Multi-Agent对话框架的LLM自动软件开发应用程序。他们为各种gpt分配不同的角色来协作开发软件,针对特定场景制定专门的解决方案。
基于Multi-Agent的LLM 应用开发框架:Autogen
在单Agent和Multi-Agent的应用开发中,大家看到了我们之前提到的,LangChain与Autogen,就是为了Agent开发而出现的应用开发框架。
技术架构
纯prompt
基本的对话式,你问一句,我答一句。。。
Agent + Function Calling
Agent:AI 主动提要求 Function Calling:AI 要求执行某个函数 场景举例:你问过年去哪玩,ta 先反问你有多少预算RAG(Retrieval-Augmented Generation)
Embeddings:把文字转换为更易于相似度计算的编码。这种编码叫向量 向量数据库:把向量存起来,方便查找 向量搜索:根据输入向量,找到最相似的向量 场景举例:考试时,看到一道题,到书上找相关内容,再结合题目组成答案。然后,就都忘了Fine-tuning
大模型的微调
如何选择技术路线
面对一个需求,如何选择技术方案?下面是个不严谨但常用思路。
题外话:值得尝试 Fine-tuning 的情况
刚接触LLM的小伙伴在听到Fine-tuning的时候都觉得蛮高级的,在我实际工作中应用了一段时间大模型之后,我自己的感受时,在很多基础应用场景中,我们用好提示工程,就足够了。
值得尝试 Fine-tuning 的情况
提高大模型的稳定性 用户量大,降低推理成本的意义很大 提高大模型的生成速度总结
本文章,我们从大模型目前应用的典型业务架构和技术架构进行分析,让大家初步能够了解我们都是在如何使用LLM的,从而大家在自己的实际落地场景中,也可以对照分析,如何建设自己的业务架构和技术架构,以及选择什么样的技术路线。
大模型岗位需求
大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
掌握大模型技术你还能拥有更多可能性:
• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;
• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。
-END-
如何系统的去学习大模型LLM ?
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料
包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
😝有需要的小伙伴,可以V扫描下方二维码免费领取🆓
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
四、AI大模型商业化落地方案
阶段1:AI大模型时代的基础理解
目标:了解AI大模型的基本概念、发展历程和核心原理。 内容: L1.1 人工智能简述与大模型起源 L1.2 大模型与通用人工智能 L1.3 GPT模型的发展历程 L1.4 模型工程- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践 L1.5 GPT应用案例
阶段2:AI大模型API应用开发工程
目标:掌握AI大模型API的使用和开发,以及相关的编程技能。 内容: L2.1 API接口- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例 L2.2 Prompt框架
- L2.2.1 什么是Prompt
- L2.2.2 Prompt框架应用现状
- L2.2.3 基于GPTAS的Prompt框架
- L2.2.4 Prompt框架与Thought
- L2.2.5 Prompt框架与提示词 L2.3 流水线工程
- L2.3.1 流水线工程的概念
- L2.3.2 流水线工程的优点
- L2.3.3 流水线工程的应用 L2.4 总结与展望
阶段3:AI大模型应用架构实践
目标:深入理解AI大模型的应用架构,并能够进行私有化部署。 内容: L3.1 Agent模型框架- L3.1.1 Agent模型框架的设计理念
- L3.1.2 Agent模型框架的核心组件
- L3.1.3 Agent模型框架的实现细节 L3.2 MetaGPT
- L3.2.1 MetaGPT的基本概念
- L3.2.2 MetaGPT的工作原理
- L3.2.3 MetaGPT的应用场景 L3.3 ChatGLM
- L3.3.1 ChatGLM的特点
- L3.3.2 ChatGLM的开发环境
- L3.3.3 ChatGLM的使用示例 L3.4 LLAMA
- L3.4.1 LLAMA的特点
- L3.4.2 LLAMA的开发环境
- L3.4.3 LLAMA的使用示例 L3.5 其他大模型介绍
阶段4:AI大模型私有化部署
目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。 内容: L4.1 模型私有化部署概述 L4.2 模型私有化部署的关键技术 L4.3 模型私有化部署的实施步骤 L4.4 模型私有化部署的应用场景学习计划:
阶段1:1-2个月,建立AI大模型的基础知识体系。 阶段2:2-3个月,专注于API应用开发能力的提升。 阶段3:3-4个月,深入实践AI大模型的应用架构和私有化部署。 阶段4:4-5个月,专注于高级模型的应用和部署。
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓
总结
**文章总结:**本文深刻解析了大模型在当今广泛应用中的衍生概念、体系、场景以及业务架构和技术架构。首先,文章介绍了大模型的两种主要技术方向,即建设和训练基础大模型以及基于基础大模型的应用开发。随后,文章列举了三种典型的业务架构模式:AI Embedded模式、AI Copilot模式、AI Agent模式,并详细阐述了它们的运作原理和应用特点。特别地,AI Agent模式被进一步细化为单Agent和Multi-Agent两种类型,并举例说明了它们在实践中的应用系统。
在技术架构部分,文章介绍了纯prompt、Agent + Function Calling、RAG(Retrieval-Augmented Generation)、Fine-tuning等技术策略,并解释了它们在构建具体系统时的应用价值。文章还特别强调了Fine-tuning在某些情况下的优势,如提高稳定性、降低推理成本、提高生成速度等。
最后,文中列出了面对业务需求时如何选择技术路线的建议,并分享了系统学习大模型(LLM)的资源和途径。通过提供全面而系统性的学习路线、书籍、资料、视频教程和实战项目,希望能够帮助想要深入了解和掌握大模型技术的读者。此外,文中也提到了大模型时代对人才需求的变迁,强调了掌握大模型技术的职业发展机遇和挑战。
**核心信息提要**:
**1. 技术方向**: 大模型技术主要包括基础模型建设和应用层开发两个方面。
**2. 业务架构**: AI Embedded、AI Copilot、AI Agent是三种主流的业务架构模式,其中AI Agent分为单Agent和Multi-Agent两类。
**3. 技术架构**: 纯prompt、Agent + Function Calling、RAG、Fine-tuning等技术为构建大模型应用提供支持。
**4. 学习资源**: 文中提供了涵盖学习路线、报告合集、经典书籍、实战项目在内的大量学习资源,旨在为读者提供系统、全面、深度的学习指导。
**5. 职业发展**: 大模型时代引发了新一轮的人才需求,掌握相关技术的个人将面临广阔的职业发展前景。