Meta的首席科学家兼深度学习先驱Yann LeCun表示,他认为目前的AI系统距离达到某种层面上的感知还需要几十年的时间,这些系统配备了常识,可以推动它们的能力不仅仅是以创造性的方式总结堆积如山的文本。
他的观点与NVIDIA的首席执行官黄仁勋的观点形成鲜明对比,黄仁勋最近表示,AI将在不到五年的时间里与人类竞争,在大量脑力密集型任务中击败人类。
在最近的一次活动中,LeCun强调了Meta基础AI研究团队成立10周年,他说:“我了解黄仁勋。”LeCun表示,这位NVIDIA的首席执行官将从AI热潮中获益良多。“有一场AI战争,而他正在提供武器。”
在谈到试图开发AI的技术人员时,LeCun说:“如果你认为AGI加入了进来,你必须购买的图形处理器越多。”AI是一种与人类水平的智能相当的AI。只要OpenAI等公司的研究人员继续追求AGI,他们就会需要更多NVIDIA的计算机芯片。
LeCun说,人类社会更有可能在人类水平的AI之前几年获得“猫水平”或“狗水平”的AI。科技行业目前对语言模型和文本数据的关注,将不足以创建研究人员几十年来一直梦想的那种先进的类似人类的AI系统。
“文本是一个非常糟糕的信息来源,” LeCun说,他解释说,人类可能需要2万年才能阅读到用于训练现代语言模型的大量文本。“用相当于2万年的阅读材料来训练一个系统,他们仍然不明白,如果A和B一样,那么B就和A一样。”
LeCun说:“这个世界上有很多非常基本的东西,他们只是不能通过这种训练。”
因此,LeCun和其他Meta AI高管一直在大量研究如何对用于创建ChatGPT等应用的所谓变压器模型进行定制,以处理包括音频、图像和视频信息在内的各种数据。这种想法认为,这些AI系统越能发现这些不同类型数据之间可能存在的数十亿美元的隐藏关联,它们就越有可能执行更神奇的壮举。
Meta的一些研究包括一款软件,可以帮助人们在佩戴该公司的Project Aria增强现实眼镜时,教人们如何更好地打网球,该眼镜将数字图形融入现实世界。高管们展示了一段演示,在演示中,一名戴着AR眼镜的人在打网球时能够看到视觉提示,教他们如何正确握住网球拍并以完美的形式挥动手臂。为这类数字网球助手提供动力所需的AI模型,除了文本和音频之外,还需要融合三维视觉数据,以防数字助手需要说话。
这些所谓的多模式AI系统代表着下一个前沿,但它们的开发不会便宜。随着Meta和谷歌母公司Alphabet等更多公司研究更先进的AI模型,NVIDIA可能会获得更大的优势,特别是在没有其他竞争出现的情况下。
未来的AI硬件
NVIDIA一直是GenAI的最大受益者,其昂贵的图形处理单元成为用于训练大量语言模型的标准工具。Meta依靠16000个NVIDIA A100图形处理器来训练其Llama AI软件。
记者询问,随着Meta和其他研究人员继续开发这些复杂的AI模型,科技行业是否会需要更多的硬件供应商。
LeCun说:“它不需要它,但它会很好。”他补充说,当谈到AI时,GPU技术仍然是黄金标准。
尽管如此,他说,未来的计算机芯片可能不会被称为GPU。
LeCun说:“你将看到有希望出现的是不是图形处理单元的新芯片,它们只是神经、深度学习加速器。”
LeCun也对量子计算持怀疑态度,微软、IBM和谷歌等科技巨头都在量子计算上投入了大量资源。Meta以外的许多研究人员认为,量子计算机器可以推动药物发现等数据密集型领域的进步,因为它们能够使用所谓的量子比特执行多次计算,而不是现代计算中使用的传统二进制比特。
但LeCun对此表示怀疑。
LeCun说:“你用量子计算可以解决的问题的数量,你可以用经典计算机更有效地解决。”
“量子计算是一个引人入胜的科学话题,” LeCun说,目前还不太清楚“实际的相关性和制造真正有用的量子计算机的可能性”。
Meta高级研究员、前技术主管Mike Schroepfer对此表示赞同,他说,他每隔几年就会对量子技术进行评估,并认为有用的量子机器“可能会在某个时候出现,但它的时间跨度太长,与我们正在做的事情无关。”
Schroepfer说:“我们十年前开始建立AI实验室的原因是,很明显,这项技术将在未来几年内实现商业化。”