整理丨诺亚
出品 | 51CTO技术栈(微信号:blog51cto)
近日,苹果宣布,全球开发者大会(WWDC)将于6月10日(北京时间6月11日)开幕,大会面向所有开发者全程在线开放。
据官方新闻稿介绍,本次活动“旨在展示 iOS、iPadOS、macOS、watchOS、tvOS 和 visionOS 的前沿创新”。此前多方报道称 AI 将会成为下一个大版本 iOS、macOS 等系统的主要更新方向。
传闻也并非无的放矢。向来保守的苹果正积极寻求合作以提升其生成式人工智能技术实力。最新报告显示,该公司将采用来自百度的生成模型“Ernie 4.0”,以为其iPhone 16及iOS 18提供技术支持。报道补充称,苹果最初曾接触阿里巴巴,但最终选择了百度作为合作伙伴。这一决定导致百度在港交所的股价上涨了6%。
图片
苹果对使用百度模型感兴趣的一个原因是:在中国,生成式人工智能模型在广泛应用前需要获得政府批准。自监管部门开始审批流程以来的前六个月里,包括百度的Ernie机器人在内的超过40个人工智能模型已获批在中国公众场合使用。
这并非苹果首次寻求此类合作。在此之前,苹果分别就GPT-4与OpenAI进行了讨论,以及针对Gemini与Google展开了会谈。从表面看,苹果似乎已经放弃了自主研发大型语言模型,转而计划为其设备外包生成式模型技术。但事实果真如此吗?
1.迄今为止,进展顺利
在年度股东大会上,苹果首席执行官蒂姆·库克表示,公司将在今年晚些时候披露更多关于实施生成式人工智能的计划,并乐观地认为苹果将在今年“在生成式AI领域取得重大突破”。
自从内部测试了一个被员工昵称为“Apple GPT”的聊天机器人以来,苹果在生成式人工智能方面取得了显著进步。最近,苹果正探讨与新闻出版商签订价值至少5000万美元的多年协议,以便为其生成式人工智能模型提供训练数据。
最近,苹果加大了对自主研发大型语言模型(LLM)的投入力度。其最近发布的MM1系列包含了稠密型变体高达300亿参数以及混合专家(MoE)架构的变体高达640亿参数的多模态模型。这些模型擅长处理和理解文本及图像信息,能够识别物体、场景乃至元素之间的关联关系。
去年,苹果开源了一款名为Ferret的多模态生成式AI模型,该模型能够基于图像和文本,理解和生成响应。此外,苹果最近收购了加拿大的AI初创公司DarwinAI,并将其数十名员工纳入自家的人工智能部门。
今年早些时候,为了集中精力发展生成式AI,苹果暂时搁置了电动汽车(EV)项目。作为从EV项目转移的一部分,库克宣布将把“参与汽车项目工作的许多员工”重新分配到人工智能部门从事生成式AI项目。
2.苹果的竞争优势在于硬件
不同于微软、谷歌和AWS等在生成式AI领域的主要玩家,它们主要提供云服务并在云端广泛应用大模型,而苹果则专注于在设备端实现生成式AI解决方案。
许多人预测苹果将在今年六月的WWDC 2024大会上宣布有关Siri的重大更新。新款AI驱动的Siri预计将能进行更接近人类、更具语境化的对话,并有望基于用户的喜好和习惯提供更个性化的服务。
苹果的核心竞争力体现在其硬件上,尤其是M3 Max芯片和A17仿生芯片,在边缘计算环境中运行生成式AI应用展现出强大的潜力。去年,苹果开源了MLX框架,这是一个针对苹果硅芯片的机器学习阵列框架,并展示了MLX实际操作中的例子,如使用Stable Diffusion在苹果硅硬件上进行图像生成任务。
当前,除了苹果之外,三星也在AI领域大量投资。它是首家与谷歌云合作,在Vertex AI云端部署Gemini Pro和Imagen 2技术应用于Galaxy S24系列手机的公司。与OpenAI不同,谷歌专门为Android手机开发了一款名为Gemini Nano的LLM。
苹果与谷歌合作是有道理的,毕竟谷歌每年已支付数十亿美元成为Mac、iPad和iPhone上Safari浏览器的默认搜索引擎。这样的合作可以成为双方伙伴关系的良好延伸,并可能促成更好的交易条件。
苹果致力于提升其设备的智能化程度,同时明智地避免直接参与到通用人工智能(AGI)竞赛中去。正如Pedro Domingos所总结的那样,在苹果的语境下,AGI意味着“Apple's Giving up on Intelligence”(苹果放弃追求全面智能),暗示苹果更注重实际应用场景中的智能优化而非追求泛化的AGI。
参考链接:
https://analyticsindiamag.com/apple-appears-to-have-achieved-agi/