OpenAI谷歌苹果再燃AI争霸战，谁将担纲「Her」时代王者？

新一轮AI大战，即将拉开序幕！

下周一，OpenAI将开启线上直播，官宣GPT-4升级，甚至还有一个超级「AI助手」等着我们。

OpenAI「音频AGI研究负责人」Alexis Conneau已更换主页背景，并与奥特曼同频——下周我们将会见证Magic。

OpenAI研究科学家Bowen Cheng甚至表示，这可比GPT-5酷多了。

这些种种，暗示着真正的「Her」即将登场。

顶着OpenAI的压力，谷歌将在第二天的I/O大会上公布模型新进展，据传还将发布一个名为「Pixie」个人数字助理，由Gemini加持。

紧接着，微软将在21日召开Build开发者大会，大概率将OpenAI最新能力集成到自家产品线中，甚至可能会透露最新5000亿参数自研大模型MAI-1。

还有万众期待的苹果WWDC大会，将发布集成生成式AI能力的iOS 18系统，并把ChatGPT塞进iPhone之中。

一系列重磅发布，连番轰炸，简直不给其他公司喘气的机会。

有网友问道，「苹果是在放弃自己的『AJAX』人工智能系统，全力与OpenAI公司合作？还是直到他们的AI能力赶上之前，OpenAI只是权宜之计」？

苹果内幕人Gurman总结了苹果的人工智能战略：

- 设备端LLM（自研）

- 云端LLM（自研）

- 聊天机器人（可能是OpenAI，也可能是谷歌）

苹果不打算自己开发聊天机器人，但意识到市场对此有需求，因此会从外部获取这项技术。这一策略与其在搜索领域的做法相似。

显然，现在的局面是，OpenAI与微软、甚至苹果通过AI合作捆绑在一起，只剩下谷歌自己单打独斗。

不知，这波AI争霸之战，谁胜谁负？

ChatGPT可以通话，周一直播再爆料

全网的焦点，还是在OpenAI。

「他们将会发布什么」，这一话题热度只增不减，鲜有人讨论谷歌I/O大会。

关于周一的发布预测，网友Ananay又有了一个新发现：

ChatGPT或将具备具备通话能力

其实可以从如下代码中，打电话、拒接等关键词中，可以看出这一功能。

另外，OpenAI已经部署了webRTC服务器来实现这一功能，这些服务器最近也进行了配置。

起初，网友还以为，这是OpenAI部署WebRTC服务器可能是为了纯语音模式，而现在看来，并非如此。

因为，这个功能是由Livekit提供的。（这是一个可以提供实时音视频通信的解决方案）

下面网友评论道，这是不是意味着，ChatGPT能够主动给我打电话，而不需要我先发起呼叫？

他提出这一问题，是因为在电影Her中，人工智能助手Samantha主动给男主人公打了电话，告知他一些事情。

想象一下，ChatGPT助手主动给你打电话，提醒或查看用户习惯，将是多么神奇的一件事。

不过，Ananay表示，这需要用户自己选择允许这一功能。

Hallid.ai的联合创始人indigo也做了一个全面的预测/趋势猜想。

根据indigo的介绍，GPT-4的新版应该会按照参数规模不同，分化成多个版本。

昨天，就有网友猜测，可能会有gpt4-lite、gpt4-auto、gpt4-lite-auto的版本发布。

而几天前出现在LMSYS竞技场上的gpt2-chatbot，可能是轻量级的GPT-4新版。而且，这意味着，GPT-3.5的使命要结束了，最新轻量版本可能会免费用，同时API价格大降。

至于，奥特曼所说的「魔法」，可能就是升级后的GPT-4——gpt4-auto，具备自主执行Agent任务的能力，记忆更强，规划能力更强。

当然，「AI助手」也将Her带入现实。

来源：indigo

昨天，OpenAI视频生成研究科学家Will Depue发了一张奇点降临的logo，或许又在暗示着什么。

谷歌打擂台，或推出AI助手Pixie

在这个与OpenAI和微软对飙的关键时刻，谷歌明确表示，这场大会发布的内容都是关于AI的。

根据谷歌官网，本年度的I/O大会将在美东时间5月14日下午1点召开。

据猜测，谷歌将在搜索引擎中融合生成式AI，让用户可以进行对话式搜索。

此外，谷歌也一直在测试新的搜索功能，比如针对英语学习者的AI对话练习，以及在购物时生成虚拟试穿图像。

不仅仅是搜索引擎，更多的谷歌应用也会更深入地集成AI功能，比如在Google Maps中帮用户找到合适的餐厅、购物中心和电动汽车充电站。

打客服电话时转接太久怎么办？

谷歌测试的AI新功能甚至可以帮你自动等待转接，直到有人接听再来通知你。

除了各种应用，操作系统也不能落下。

上个月Android 15的开发者预览已经发布，谷歌将在I/O大会上进一步介绍其中的新功能，可能会加入更深度的Gemini集成。

目前在安卓系统中，生成式AI的功能主要由Gemini Nano驱动，用在各种软件功能中。

比如Magice Compose可以在Google Messages等应用程序中提供回复建议，Cinematic Wallpaper利用机器学习帮助用户定制屏幕壁纸。

可以想象一下，有AI进一步参与的安卓会带来哪些更个性化的用户体验？比如，更智能的手机主屏幕、锁屏界面和通知栏？

去年的I/O大会上我们看到了与ChatGPT竞争的大语言模型Gemini，今年是否会有新的模型出现呢？

除了Gemini的新版本，或许也可以期待一下谷歌推出的图像和视频大模型。

Reddit上有网友爆料，称谷歌存货中有3个模型已经在测试但还未向公众发布，估计会在2024 I/O大会亮相。

这三个模型分别是图像生成模型Imagen 3，以及两个可以对图像进行优化、补全的模型Juno和Miro。

据说，Miro还会有视频生成的功能。

此外，谷歌可能会在今年I/O上发布新版本的AI助手「Pixie」，或许可以取代原有的同类产品Google Assistant。

Pixie由语言模型Gemini驱动，安装在谷歌自己开发的硬件设备Pixel上，对其他第三方设备是否开放我们尚未可知。

但本次I/O大会上我们应该不会看到更新版本的Pixel产品，谷歌已经在近期发布了新版本Pixel 8a，而且已经开放给用户预定购买。

网上流出的新版本Pixel 9外观

预计，Pixel 9与折叠款Pixel 9 Pro Fold预计将在今年秋季发布。

苹果紧抓救命稻草

与此同时，面对OpenAI和谷歌来势汹汹的AI语音助手冲击，网友们向苹果喊话：

留给苹果的时间不多了！

虽然已有消息称OpenAI与苹果即将敲定一项合作协议，让ChatGPT能够装进iPhone中，并为今年的iOS系统提供全新的生成式AI能力。

但苹果并不准备放弃自家的Siri。

近日，纽约时代报道，苹果将对Siri进行升级重组，以应对其他聊天机器人竞争对手。

而这一决定早已做下。

2023年年初，苹果高管Craig Federighi和John Giannandrea花费数周时间测试了风头一时无两的OpenAI新聊天机器人ChatGPT后，就深感危机。

他们认为生成式人工智能的出现让Siri显得过时、落后。

Siri作为苹果2011年推出、每部iPhone中最初的虚拟助手，一直以来都仅限于满足个人请求，不能跟上用户发起的对话。

例如，有人先询问了旧金山的天气然后说：「纽约怎么样？」时，Siri经常会误解用户的提问。

但ChatGPT知道用户想要的是后一个问题的回答。

在意识到新技术已经超越Siri之后，这家科技巨头发起了十多年来最重大的重组。

苹果公司决心在科技行业的人工智能竞赛中迎头赶上，它将生成式人工智能作为公司内部的特殊标杆项目，围绕着十年一遇的计划来组织员工。

Siri超进化

据苹果的三名内部人士透露，苹果将于今年6月10日的年度开发者大会上发布改进后的Siri。

新版本中的基础技术包含新的生成式人工智能，将允许Siri与用户进行聊天而不是一次回答一个问题。

并且使Siri的对话性更强、用途更广。

Siri的更新是苹果公司在全面拥抱生成式AI 领域处于领先地位的举措之一。

为了支持其新的Siri功能，还在今年的iPhone中增加了内存。

此外，苹果还讨论了与包括Google、Cohere和OpenAI 在内的几家公司合作，以获得支持聊天机器人的AI模型使用权的可能性。

另一方面，苹果的高管也在担心新兴的AI技术将作为未来主要的操作系统取代iOS，威胁苹果在全球智能手机市场的主导地位。

并且，这项新技术还可能促成一个以AI应用（AI智能体）为核心的生态系统。

这可能会削弱苹果的App Store，该商店每年的销售额约为240亿美元。

但苹果更担心的是，如果不能开发出自己的AI系统，iPhone将会在与其他先进技术的比较中可能变成「哑巴手机」，失去市场。

iPhone目前占据了全球智能手机利润的85%份额，并创造了超过2000亿美元的销售额。

可以预想这个损失是不可估量的，也是苹果不能接受的。

在这种危机的紧迫感促使下，苹果取消了另一项重大的投资——

一个耗资100亿美元的自动驾驶汽车项目，并调派数百名工程师转向AI的开发工作。

并且，苹果还将延续一贯的设备流程工具上的一致性，探索创建由iPhone和Mac处理器驱动的服务器。

内部人士的爆料里，苹果对Siri的升级并不在于让它与ChatGPT竞争诗歌创作等内容生成的部分，而是让Siri专注于处理它原有的任务：

包括设置闹钟、创建日历备忘提醒、添加购物清单中的物品，以及总结短信内容。

苹果计划宣称升级后的Siri将比竞对公司的人工智能提供更加私密的服务，成本更划算。

因为Siri是在iPhone上处理请求，这避免了数据在云端的泄露以及云计算的成本。

但是，苹果公司也面临着安装在iPhone上的小型人工智能系统的风险：

研究发现，较小的人工智能系统可能比较大的系统更容易出现幻觉。

Siri联合创始人Tom Gruber表示：

「Siri的目标始终是创建一个能理解语言和上下文的对话界面，但这是个难题。

随着技术的变革，我们应该能做得更好。只要不试图用同一种方法解决所有问题，就能避免很多困难。」

苹果在人工智能领域拥有多项优势，包括在全球超过20亿台在使用的设备，领先的半导体团队等。

它们能够支持苹果推广AI产品，并支持包括面部识别在内需要大量芯片的AI任务。

一个月时间，苹果能否扭转局势

但在过去的十年里，苹果从未制定出一个全面的人工智能战略，Siri自推出以来也没有大的升级改进。

同时，作为语音助手的局限性也减弱了公司智能音箱HomePod的吸引力，因为它无法稳定完成一些简单的任务，比如响应歌曲播放请求。

曾在Siri团队工作两年后，创立了生成式人工智能平台Brighten.ai的John Burkey表示：

「Siri团队创立以来，未能获得过与苹果内其他团队同等的关注和资源。

而苹果的不同部门，往往各自独立，信息共享有限。

但事实是AI需要被整合到产品中，才能取得成功。」

另外，苹果在招募和留住领先人工智能人才方面也有着相当的阻力。

由于苹果的保密性，研究成果发表论文、参加会议的都很少，这对于科学家来说几乎是不可忍受的弊端。

最近几个月来，苹果略微调整了一贯的战略，增加了人工智能论文发表的数量，但业内的研究人员仍质疑论文的质量，认为它们是苹果的营销炒作手段。

但对一些初出茅庐且野心勃勃的研究人员来说，加入苹果能够成为项目的领导成员，是他们选择苹果的重要原因。

尽管苹果已调整了发展战略，并吸收了不少新鲜血液。

但在这场声势浩大、令人眼花缭乱的AI语音助手之战中，苹果能否在6月的开发者大会上逆转劣势尚未可知。

未来的AI语音助手形态如何，又会怎样影响我们的生活？

这个问题的答案正在不断接近我们。