AI先驱Daphne Koller在一次由斯坦福大学人类中心人工智能研究所主持的全天工作坊上发表讲话,她认为生成式AI将成为癌症研究的重要工具。Koller是生命科学人工智能公司Insitro的联合创始人兼首席执行官,她表示,AI正在与生物学融合,这一结果被称为数字生物学,将在人类健康领域产生巨大影响。
图源备注:图片由AI生成,图片授权服务商Midjourney
在她的演讲中,Koller介绍了一种利用生成式AI来分析癌症组织图像的两步过程。首先,Insitro的机器学习AI技术能够分析来自活检的癌症组织的组织学图像。Koller指出,通常情况下,人类病理学家会将这些数十亿像素的图像简化为三个数字,但实际上这些图像中包含了更多未被利用的信息。通过使用机器学习,计算机可以真正学习组织学的语言,从而使机器能够以90%至95%的准确率预测患有癌症的患者的遗传变化。
然而,为了找到药物靶点,需要更多的组织样本,而实际上收集到的样本往往很有限,只有几十个。为了解决这个问题,Insitro团队使用生成AI来创建组织图像的“深度伪造”。
Koller解释说,他们生成的不是电影明星的图像,而是病理学幻灯片的图像。通过将组织样本从数百个增加到数千个,研究人员可以使用斯坦福大学开发的特殊工具进行分析,这个工具称为“ATAC-seq”测定。团队成功从400个癌症组织图像样本扩展到了近10万个。这一规模开始使得可以提出在样本较少的情况下无法回答的问题。
生成AI被用于创建组织图像的“深度伪造”,从而扩大了可以使用基因测定进行挖掘的样本规模。通过分析数千个深度伪造的三阴性乳腺癌图像,技术揭示了以前未知的可能成为药物靶点的遗传变化。Koller表示,一些这些靶点在三阴性乳腺癌中是新颖的,但它们已被涉及到其他癌症中。这给人们信心,这些变化在癌症中发挥了因果作用,可能成为有趣的新药物靶点。
Koller将生成AI在生物学中的应用描述为处理人类大脑永远无法理解的复杂程度。为了解决这个领域的问题,我们需要首先以前所未有的保真度和规模收集大量数据,不同生物层次的数据,然后让机器做它们比人类做得更好的事情,即理解这些数据中的微妙模式,帮助我们重新定义人类疾病的多样性和复杂性,并找出可能在临床上起作用的干预点。
Koller认为,数字生物学将在人类健康以及环境、能源、生物材料和可持续农业等多个领域产生巨大影响,这也是为什么她认为这是一个非常令人兴奋的领域。