有关化学合成的文献数量快速增长;然而,实验室之间共享和评估新流程需要很长时间。
在此,来自加拿大不列颠哥伦比亚大学(UBC)和英国格拉斯哥大学的研究团队,提出了一种方法,使用通用化学编程语言(χDL)在两个实验室的四种不同硬件系统上编码和执行各种化学反应的合成程序,包括还原胺化、成环、酯化、碳-碳键形成和酰胺偶联。每个反应大约有 50 行代码,所提方法使用抽象来有效地压缩化学协议。
不同的机器人平台始终如一地产生预期的合成,每步产量高达 90%,从而实现更快、更安全的研究工作流程,可以通过数量增加而不是规模扩大来提高过程的吞吐量。
该研究以《Universal chemical programming language for robotic synthesis repeatability》为题,于 2024 年 1 月 11 日发布在《Nature Synthesis》上。
论文链接:https://www.nature.com/articles/s44160-023-00473-6
科学中的「可重复性危机」
可重复性和可证伪性对于科学研究至关重要,但已发表数据量的不断增加使得确保已发表结果的验证变得越来越困难。此外,自动化和机器学习的发展和集成目前正在改变化学领域。
目前,缺乏对成功和失败的实验进行编码和记录的开放标准,阻碍了复杂数字工具的使用,从而对研究进展产生了不利影响。有关研究甚至谈到了科学中的「可重复性危机」,强调了开发新策略来有效验证数据的重要性。
在化学反应中出现了一种特征-几乎是技术性的——语言风格,用于交流实验协议。尽管有这种共同语言,再现反应仍然具有挑战性,并且通常需要人类化学家的专业知识来解释平淡的协议并推断隐含的信息。如果没有有效的方法来捕获化学协议中的隐性知识,可靠的通信和实验验证将变得棘手,化学的进步将无法充分发挥其潜力。
χDL:一种机器可读的通用化学描述语言
标准化自动化化学的挑战可以通过捕获 χDL 中的化学知识来解决,χDL 是一种机器可读的通用化学描述语言,允许用户以人类和机器人都可以理解的标准化方式存储实验方案。χDL 在设计上与平台无关,能够与任何自动化化学硬件连接。它是在 Chemputer 平台上进行原型设计的,但足够灵活,可以快速集成到为完全不同的化学目的而设计的系统上
在此,研究人员通过在 Opentrons 平台、Kinova 多轴 cobotic 机器人和两个 Chemputers 上执行相同的 χDL 协议来展示这一点,强调相同的代码在多个硬件架构上同样可执行。χDL 不受各个平台的硬件限制,用于将不同的机器组合到一个工作流程中,并增强化学家设计实验的整体能力。
研究涉及七个反应步骤和三种最终化合物的三个案例研究的方案经过验证和传播,以便在两个国际实验室和三个独立机器人上重复。
以 χDL 形式共享数字程序有利于合作研究项目,其中可以结合不同平台和实验室的优点和劳动力来优化合成方案,共同实现更大的影响。
图示:χDL 的普适性。(来源:论文)
Chemputation 的概念体现在 χDL 驱动的各种机器人上执行不同的化学反应,为更快、更富有成效的合作项目打开了大门。通过这种方法,合成任务可以轻松地在不同实验室之间分配,因为化学知识可以作为现成运行的源代码进行交流,不需要更深入地了解基本的化学原理。
例如,研究小组可以无缝地研究合作者合成的核心分子的功能化,而无需投入时间进行手动合成或因运输时间而延迟项目。研究已经展示了七种化学反应的工作流程的简便性,包括多步合成、聚合合成方法和反应性的发散探索,展示了 χDL 编码合成的产率和纯度如何在不同的迭代、地理位置和硬件设置中出色地重复。