在 Meta 庆祝其基础 AI 研究团队成立 10 周年的活动中,该公司首席科学家兼深度学习先驱 Yann LeCun 表达了对当前人工智能系统发展的看法。LeCun 认为,现有 AI 系统距离达到某种程度的自我意识,具备推动其能力超越仅仅以创造性方式总结大量文本的常识,仍有数十年的时间。
LeCun 的观点与英伟达(Nvidia)首席执行官黄仁勋的看法形成鲜明对比。黄仁勋最近表示,AI 将在不到五年内与人类「相当竞争」,在许多智力密集型任务上胜过人类。
LeCun 在活动中提到,他认识黄仁勋,且黄仁勋从 AI 热潮中获益良多。「存在一场 AI 战争,他正在提供武器。」
LeCun 说,关于技术人员试图开发人工通用智能(AGI)的情况,「[如果] 你认为 AGI 已经到来,那么你必须购买更多的 GPU。」只要像 OpenAI 这样的公司继续追求 AGI,他们就需要更多的英伟达计算机芯片。
LeCun 认为,社会更有可能在数年前获得「猫级」或「狗级」AI,而不是人类级 AI。他还表示,科技行业目前对语言模型和文本数据的关注不足以创造出研究人员几十年来一直梦想的高级人类般的 AI 系统。
「文本是一个非常贫乏的信息来源,」LeCun 说。他解释说,训练现代语言模型所使用的文本量可能需要人类 20000 年来阅读。「训练一个系统使用相当于 20000 年阅读材料的数据,它们仍然不明白如果 A 与 B 相同,那么 B 也与 A 相同。」
LeCun 表示:「通过这种训练,他们对世界的很多基本事物仍然一无所知。」
因此,LeCun 和其他 Meta AI 高管一直在深入研究如何将用于创建 ChatGPT 等应用程序的所谓 Transformer 模型定制为适用于各种数据,包括音频、图像和视频信息。这些 AI 系统能够发现这些不同种类数据之间可能存在的数十亿隐藏相关性,从而可能表现出更多神奇的能力。
Meta 的一些研究包括能够帮助人们佩戴公司的 Project Aria 增强现实眼镜更好地学习打网球的软件,这种眼镜将数字图形融入现实世界。高管们展示了一个演示,其中一个佩戴 AR 眼镜的人在打网球时能够看到视觉提示,教他们如何正确握住网球拍并以完美的姿势挥动手臂。提供这种数字网球助手所需的 AI 模型类型需要结合三维视觉数据以及文本和音频,以防数字助手需要说话。
这些所谓的多模态 AI 系统代表着下一个前沿,但它们的开发成本并不便宜。随着 Meta 和谷歌母公司 Alphabet等公司研究更先进的 AI 模型,英伟达可能会获得更多优势,特别是如果没有其他竞争出现的话。
未来的 AI 硬件
英伟达一直是生成 AI 的最大受益者,其昂贵的图形处理单元成为训练大型语言模型的标准工具。Meta 依靠 16000 个英伟达 A100 GPU 来训练其 Llama AI 软件。
CNBC 询问,随着 Meta 和其他研究人员继续开发这类复杂的 AI 模型,科技行业是否需要更多的硬件提供商。
LeCun 表示:「这不是必需的,但如果有就好了。」他补充说,目前 GPU 技术仍是 AI 领域的黄金标准。
不过,他说,未来的计算机芯片可能不会被称为 GPU。
「你将有望看到新的芯片出现,不是图形处理单元,它们只是神经网络、深度学习加速器,」LeCun 说。
LeCun 还对量子计算持有一定的怀疑态度,微软、IBM 和谷歌等科技巨头都在其中投入了资源。许多 Meta 之外的研究人员认为,量子计算机可以加速数据密集型领域(如药物发现)的进展,因为它们能够使用所谓的量子比特(而不是现代计算中使用的常规二进制比特)进行多项计算。
但 LeCun 对此表示怀疑。
「你可以使用传统计算机更高效地解决更多问题,」LeCun 说。
「量子计算是一个迷人的科学话题,」LeCun 说。关于「实际相关性和制造实际有用的量子计算机的可能性」还不那么清楚。
Meta 高级研究员兼前技术长 Mike Schroepfer 表示赞同,他说他每隔几年就会评估量子技术,并认为有用的量子机器「可能会在某个时候出现,但它的时间范围太长了,与我们正在做的事情无关。」
「我们十年前开始建立一个 AI 实验室的原因是,很明显这项技术将在未来几年内商业化,」Schroepfer 说。