未来五年AI如何改变各学科？从LLM到AI蛋白设计、医疗保健......

五年前（2019 年 1 月），《Nature Machine Intelligence》创刊。当然，就人工智能（AI）而言，五年前似乎是一个不同的时代。

1 月 24 日，Nature Machine Intelligence 杂志在《Anniversary AI reflections》（周年人工智能反思）专题中，再次联系并采访了近期在期刊发表评论和观点文章的作者，请他们从各自所在领域中举例说明人工智能如何改变科学过程。

想知道，他们对人工智能领域的哪些其他主题感到兴奋、惊讶或担忧，以及他们对 2024 年以及未来五年的人工智能的希望和期望是什么。一个反复出现的主题是大型语言模型和生成人工智能的持续发展、它们对科学过程的变革性影响以及对伦理影响的担忧。

引人注目的是，这些作者强调了人工智能如何彻底改变了各个学科；例如，正如西班牙赫罗纳大学（University of Girona）Noelia Ferruz 提到的，蛋白质设计和工程领域。但他们也讨论了 LLM 的最新发展，例如 ChatGPT 和生成人工智能，如何改变了整个研究工作流程，包括科学写作过程、编码和头脑风暴。

此外，他们预测，鉴于 LLM 和生成式人工智能的持续发展，未来五年将带来进一步的实质性变化，例如连接到物理世界的个性化模型和人工智能代理框架。正如有作者强调的那样，这些变化无疑会带来进一步的道德挑战。

赫罗纳大学 Noelia Ferruz：专注于 AI 蛋白设计

你的观点是关于什么的？

我们的文章回顾了大语言模型（LLM）在蛋白质研究领域的应用，特别关注 Transformer 架构及其各种训练技术。我们密切关注生成 LLM 在蛋白质设计中的实施和使用，并讨论了它们在未来几年的潜力。

论文链接：https://www.nature.com/articles/s42256-022-00499-z

该领域是如何发展的？

人工智能正在快速发展，在过去的一年里我们见证了令人难以置信的进步。扩散模型在生成图像方面取得了前所未有的成功，2022 年末，OpenAI 发布了 ChatGPT，展示了在文本生成方面的卓越性能。

这些进步也影响了蛋白质设计领域，近几个月发布了几种蛋白质扩散模型，促进了对传统上具有挑战性的设计案例的重新思考。

人工智能的哪些发展最令您惊讶或兴奋？

我发现生成基础模型的功能非常令人惊讶，例如能够生成文本（ChatGPT、Bard）和图像（DALL·E 2、Stable Diffusion）的模型。最近，结合多种数据类型来训练多模态 LLM（MLLM）引发了新一轮的兴奋浪潮，一些 MLLM 已经集成了文本和图像，例如 GPT-4、Kosmos-1 或 GATO，其他一些甚至已经嵌入到机器人框架中，例如 PaLM-E。这些智能体的初步表现暗示它们可能是迈向通用智能的第一步。

尽管这些进展仍需要应用于蛋白质设计领域，但蛋白质固有的多模态和可用于自监督学习的未标记数据量表明这一应用是可行的，它可能使我们更接近实现具有可控特性的蛋白质设计。

您能举出人工智能如何改变科学过程的例子吗？

ChatGPT 等生成模型彻底改变了科学写作，引发了人们的疑问：如何将这些工具整合到我们的教育系统中，以及我们如何检测科学评论和出版中的不当行为。在蛋白质的特定背景下，研究领域在过去三年中经历了彻底的转变，从基于物理的方法转向人工智能引导的工具。

现在，我们不仅可以解决传统的蛋白质设计问题，而且我们也有丰富的方法来生成结构或序列，或者围绕给定的支架定义两者。这些人工智能模型在实验室环境中表现出显著提高的性能，减少了时间要求并提高了传统上具有挑战性的蛋白质设计任务的成功率。我们现在可以设计几年前超乎想象的蛋白质系统。

您对 2024 年以及未来 5 年的人工智能有何希望或期望？

我对各个人工智能领域的快速进步感到乐观，包括文本和图像生成、机器人技术和多任务自主代理。这些进展将很快扩大对蛋白质设计领域的影响。

在接下来的五年中，大型智能代理将会出现，无缝集成到机器人平台中。这些代理将有能力半自主地设计序列、分析序列并不断完善其设计，同时根据反馈提高其能力。这有望显著缩短工程周期并创建高效的设计。我相信，这项变革性技术将通过功能性蛋白质的定制开发来彻底改变众多行业，从而降低各种生物技术过程的成本，并为新的环保方法铺平道路。

未来五年AI如何改变各学科？从LLM到AI蛋白设计、医疗保健......

赫罗纳大学 Noelia Ferruz：专注于 AI 蛋白设计

更多作者信息