行业到底有多卷?
最新统计,中国已有130多个大模型问世,在网信办备案的算法模型也超过70多家。BAT等互联网巨头悉数下场发布AI大模型,仅2023年就有超60家创业公司拿到融资,产品更是布满了基础层、模型层和应用层。新一代生成式AI,可能要回头看看上一代AI趟过的坑,不要行业自嗨,避免上一个冬天的轮回。在这个领域的从业者,更要清晰地看到行业的内卷和客户的痛点,别被大佬的鸡汤迷了眼。
1、现在有客户找到我们,说有20个场景,一个场景X万块?然后挨家询价,华为做不做?阿里做不做?百度做不做?要这么卷下去,最后都没有钱赚。
2、大家融到的钱,80%-90%给到了算力,这是现状。要知道,现在还只是训练,训练的成本是可控的,推理的成本是不可控的。
3、我们GPU有30000块,算力6000p,年底争取算力超12000p。数据方面,每个月有2万亿token清洗和标注完,年底会有10万亿的token。
4、目前看,行业还是缺少一些颠覆式的杀手级的应用,从而难以实现商业化的变现。
5、怎么能够在成本和效果之间,找到一个平衡点,这是比较难的地方。都用大模型,成本太高了。
6、再过一段时间,大家要比拼的是基础设施的优化能力。比如,网络优化能力,别人断时你不断,就能比别人多训练几次。
7、在算力紧张的情况下,我们在做一些前瞻性的技术尝试。大家可能都想不到,在我们大模型公司,做基础架构的同学,比做模型的同学要多。他们普遍的价格都还挺贵,也很难招。
8、大模型现在很尴尬,自身卖不上价格,最后都是卖云卖卡卖算力的赚钱了。
9、刚开始觉得模型还挺值钱的,现在又陷入到内卷了。前段时间碰到一个客户,BAT等都报价了。刚开始报价,还挺贵,1000多万。大家知道最后的成单价是多少?太卷了。
10、百亿参数的大模型,在某些特殊客户的认知里面,就是免费的。
来自一线的声音
人工智能领域的企业,耳根子应该时刻记得毛主席说的话,“从实践中来到实践中去”。脱下长袍马褂,走到田间地头,在客户身边才能得到最真实地反馈。现在AI领域的伪专家太多了,不如多听听来自一线的声音。
11、我们大概聊了150个客户。对于大模型本身的需求主要分为两类。一类是大模型本身文字上的需求,客户对大语言模型的要求是100%准确。另一种,是AI agent,函数调用、代码显示器、调用第三方工具。
12、我们在合作过程中,出现了一个冲突矛盾。客户会觉得,在内部决定部署之前,是不能把数据拿出来给你的。但如果没有这个数据,我们又怎么能训练出适合客户需求的模型呢?
13、我们在做项目的时候发现,用户是不愿意为大模型去买单的,他还是为你的应用去买单。有的客户会直接问,有了大模型,以前的一些智能中台、知识图谱就不需要了吗?最后发现,场景才是最核心的。
14、我们要找到一些性感的场景。有几个标准。第一,小切口。第二,跟大模型的优势相匹配。第三,让买单的决策用户有强感知。比如以前获取一些数据、结论或者服务,需要不同的流程,现在通过大模型,决策者在移动设备就能快速获取和完成。
15、大模型想做成功需要三件事:1)能不能拿到足够多的钱去买算力。2)能不能拿到足够多的数据。3)人才密度是不是够厚,不在数量多,而是有没有足够多的高质量的科学家。
16、现在我们遇到三类客户。一类是焦虑的客户,比如金融的客户因为竞对都在搞,于是也想搞,但他并不清楚自己的需求是什么?一类是希望降本的客户,客户的管理层认为,这主要是降本节流的问题,但模型到底节流了多少,不好评判具体的价值。最后一类是希望部署模型开源赚钱的客户,他是靠这个模型来创收的,这类客户付费是最爽快的。
ToC 还是 ToB?
据了解,GPT-4训练一次的成本约为6300万美元,需要1.8万亿巨量参数。中国目前发布的一些大模型,ToC方向还是互联网的免费模式。但从业者都清楚,大模型的开发和运行都需要消耗大量的成本,从而ToB的商业模式更容易良性运转。在商业化探索上,ToB还是ToC,一直是行业关注的问题。在闭门会中,我们反复听到了两个关键词:1)基因 2)越界。“你无法成为你所不是的”。
17、我们认为机会还是在tob垂直模型,核心点在数据和场景本身,这是最核心的。
18、我们自己也在思考,人工智能如何跟互联网、数字化等结合起来,怎么更好地将原来的场景做得更智能。
19、ToC还是ToB,坦率讲这跟大家的基因有关。我们做不到,不代表别人做不到。比如一些ToC的应用,都是一些00后10后的小朋友在玩,超出了我们年龄的认知。
20、Toc和Tob还是很不一样的。ToC对容错率相对较高。TOB则相反。举个例子,智能问答。准确率如何保证?像政府,都是有红线的。如何避免模型的幻觉,目前大家都在做相应的探索。
21、我们反而认为ToC赚钱比较容易。ToB有个问题,一个项目的历程时间比较长。客户批预算,再到立项,再到实施,钱的周期是很长的。
22、我觉得现在是机会太多,不要把资源分到你所不是的地方,做战略选择,这个很重要。
ToB 和 ToG 也很苦
23、B端最大的bug在于,最后做成了高级的人力外包。
24、所有的项目都是有周期的,所有的付款也是根据周期的节点来走的。不可能我无限制地帮你训练和优化一个模型。
25、AIGC创作这种,包容性比较强,可以有些错误。但到一些企业生产制造,对准确性的要求就很高了。往往我们从模型中挑一两个比较好case是比较容易的,但要它维持在较高的水平里面,没有比较差的case,这个还是蛮难的。
26、我们在一个经济发达的省份去做智能数字化政府项目的时候,我们推了超过5个场景,最后客户就认可了3个场景。接着,就对安全、对数据、对底层刨根问底。接着还会问,你们跟其他大模型的差异和优势是什么?最后,多方要坐下来,出一个评测体系。评测体系过了还要评性能。
用项目孵化产品和方案
27、用项目孵化产品,做完几个项目后,抽离出相应的技术方案。这套方案,大概率不是一个模型,而是大模型+小模型,最后是多个模型形成的综合解决方案。
28、最近一两年,可能是做创新、做产品的过程,现金的回收周期会相对长一些。
Agent
想象一下人工智能模仿人类的日常任务来处理大量人类的复杂社会行为。斯坦福大学的一篇名为《Generative Agents: Interactive Simulacra of Human Behavior,titled》的论文深入研究了记忆、反应和计划的AI Agent。AI Agent 被认为是OpenAI 发力的下一个方向。OpenAI 联合创始人在近期的活动上也说:“相比模型训练方法,OpenAI内部目前更关注Agent领域的变化,每当有新的AI Agents 论文出来的时候,内部都会很兴奋并且认真地讨论 ”。
29、我们总会把大模型想象成万能的,它能解决各种各样的问题?事实是这样的么?大模型只是大模型。
30、我们内部管AI,叫隐形的AI。在用户面前,我们不会强调是什么模型,参数有多少。我们对AI的定义,就是人的辅助。
31、绕开模型,绕开算力,可能接下来的机会就是Agent。
32、目前影响客户使用的最大的问题:投入产出比。一旦跟客户聊到最后,谈到项目预算的时候,如果只是纯文字相关,投入大几百万小几百万,客户就不太满意。另外,如果大模型使用AI agent 嵌入到实际的生产环境中,解决实际的问题,客户会非常愿意买单。
33、在大模型基础上,AI Agent具备记忆、规划和执行等能力,能力加强。我们这期投了60多个初创项目,其中20多个都是Agent。
34、中国和国外,ToC的产品,付费形态和产品形态,差别也特别大。近期,我们投了一些Agent的公司。
35、但是,现阶段AI Agent只是处于新的尝试阶段,距离通用智能还有一定差距。未来还需要解决单个AI Agent综合能力之外,多个AI Agent之间协作及情感(Emotion)等方面能力表现的突破。
36、大模型玩家,要保证自己能留在牌桌上,才有机会看到下半场新的东西出来。
大模型资源分享
“最先掌握 AI 的人,相较于较晚掌握 AI 的人而言,将具备竞争优势。”这句话放在计算机、互联网以及移动互联网的开局时期,同样适用。
我在一线互联网企业工作长达十余年,期间指导过众多同行后辈,助力许多人实现了学习与成长。为此,我将重要的 AI 大模型资料,包括 AI 大模型入门学习思维导图、精品 AI 大模型学习书籍手册、视频教程以及实战学习等录播视频免费分享出来。
一、全套 AGI 大模型学习路线
AI 大模型时代的精彩学习之旅:从根基铸就到前沿探索,牢牢掌握人工智能核心技能!
二、640 套 AI 大模型报告合集
此套涵盖 640 份报告的精彩合集,全面涉及 AI 大模型的理论研究、技术实现以及行业应用等诸多方面。无论你是科研工作者、工程师,还是对 AI 大模型满怀热忱的爱好者,这套报告合集都将为你呈上宝贵的信息与深刻的启示。
三、AI 大模型经典 PDF 书籍
伴随人工智能技术的迅猛发展,AI 大模型已然成为当今科技领域的一大热点。这些大型预训练模型,诸如 GPT-3、BERT、XLNet 等,凭借其强大的语言理解与生成能力,正在重塑我们对人工智能的认知。而以下这些 PDF 书籍无疑是极为出色的学习资源。
阶段 1:AI 大模型时代的基础认知
目标:深入洞悉 AI 大模型的基本概念、发展历程以及核心原理。
内容
:
L1.1 人工智能概述与大模型起源探寻。 L1.2 大模型与通用人工智能的紧密关联。 L1.3 GPT 模型的辉煌发展历程。 L1.4 模型工程解析。 L1.4.1 知识大模型阐释。 L1.4.2 生产大模型剖析。 L1.4.3 模型工程方法论阐述。 L1.4.4 模型工程实践展示。 L1.5 GPT 应用案例分享。阶段 2:AI 大模型 API 应用开发工程
目标:熟练掌握 AI 大模型 API 的运用与开发,以及相关编程技能。
内容
:
阶段 3:AI 大模型应用架构实践
目标:深刻理解 AI 大模型的应用架构,并能够实现私有化部署。
内容
:
阶段 4:AI 大模型私有化部署
目标:熟练掌握多种 AI 大模型的私有化部署,包括多模态和特定领域模型。
内容
:
学习计划:
阶段 1:历时 1 至 2 个月,构建起 AI 大模型的基础知识体系。 阶段 2:花费 2 至 3 个月,专注于提升 API 应用开发能力。 阶段 3:用 3 至 4 个月,深入实践 AI 大模型的应用架构与私有化部署。 阶段 4:历经 4 至 5 个月,专注于高级模型的应用与部署。《人工智能\大模型入门学习大礼包》,可以关注工棕耗:AI技术星球
回🎀复:11即🉑️精准或取❕!!
总结
### 文章总结**行业现状与内卷**
- 中国AI领域竞争激烈,已推出130多个大模型,备案算法模型超70个。
- BAT巨头及众多创业公司纷纷入场,2023年超60家创业公司获融资。
- 项目成本高启,客户询价激烈,竞争激烈导致利润空间缩小。
- 行业处于投入大产出小的阶段,算力成本占融资的80%-90%,且推理成本不可控。
**技术与资源**
- 公司在GPU与数据方面大量投入,旨在提升算力和数据量。
- 缺乏颠覆性杀手应用,商业化变现难度大。
- 行业需要在成本与效果间寻找平衡点,将逐步优化基础设施,如网络优化以提高训练效率。
**客户与市场**
- 客户对AI大模型需求多样,分文字处理与AI agent两类。
- 实际项目中存在数据安全与模型训练需求之间的矛盾。
- 客户更倾向于为具体应用场景而非纯模型付费,偏好即见即用的解决方案。
- 理想客户类型包括清晰需求的降本客户与通过模型开源盈利的客户。
**ToB与ToC策略**
- ToB模式被视为更可持续的商业模式,但需长时间项目周期与严格的质量要求。
- ToC虽容错率较高,但竞争更激烈,利润空间有限。
- 战略选择与基因匹配度是成功的关键。
**AI Agent探索**
- 焦点向AI Agent转移,其记忆、规划与执行能力具备更大市场潜力。
- 已有初创项目在Agent领域布局,但尚需解决多agent协作与情感表达能力。
**大模型未来与资源分享**
- 强调大模型公司需保证自身在市场竞争中的持久性,待新机会出现。
- 分享AI大模型学习资料,包括学习路线、报告合集及PDF书籍,助力行业发展。
### 几点重要结论
- **行业内卷严重**:竞争激烈,利润空间狭小,需要差异化竞争和成本控制。
- **技术驱动**:在算力、数据与基础设施上持续投入,以技术创新保持竞争力。
- **市场多样**:重视客户需求,提供综合解决方案,而非单纯的技术输出。
- **未来方向**:AI Agent作为新兴领域具有广阔前景,需持续探索与突破。
- **资源助力**:分享宝贵的AI学习资料,促进整个行业的共同进步与发展。