Bartosz A. Grzybowski,韩国IBS软物质材料研究中心教授,承担了韩国政府特别研究经费(1000万美元/年)。他长期专注于计算机驱动的新反应和催化剂的发现,以及化学人工智能控制和优化实际实验的机器人系统,为复杂分子的计算机逆合成创建了 Chematica/Synthia 平台,创建了用于发现新合成方法和新功能分子的软件Allchemy。2016年,Bartosz A. Grzybowski荣获费曼纳米技术奖,表彰他在计算机辅助有机合成研究领域的杰出贡献。
他的研究,总是充满奇思妙想,惊为天人,从来没有让人失望过!
2020年3月4日,Bartosz A. Grzybowski等人发现在聚离子液体(PIL,一类聚电解质材料)存在的环境中,不断地搅拌会让晶体生长得更快、更大。这项研究打破传统的结晶学理论的认知(机械搅拌和剪切流容易引起二次成核,不利于晶体生长),是对当前晶体生长技术的一个重要补充,有望大幅降低材料加工和制药业中晶体生长成本。
2020年9月25日,Bartosz A. Grzybowski等研究人员构建了以水、氮气、硫化氢、氨气、氰化氢、甲烷作为起始反应物的自主催化网络,为寻找生命诞生伊始的早期化学反应网络提供了研究线索,被誉为生命起源研究的里程碑进展。
2020年9月30日,Bartosz A. Grzybowski团队靠一台离心机登上Nature封面论文。他们开发了一个类似离心机的非平衡系统,其中不同的反应区自组织成一个几何形状,可以决定整个过程序列的进展。“无壁”同心液体反应堆,将传统静态环境中的材料和/或化学系统移植到旋转参照系中,具有明显优势。这项研究提出了一种非平衡系统-旋转液体堆,将该旋转液体堆应用于多步有机合成、萃取和纳米分离等领域。
2020年10月13日,Bartosz A. Grzybowski等研究人员首次实现计算机设计合成复杂天然产物,使得机器合成不再局限于单步反应或者文献重复,进一步解放化学家的双手。
近日,他在人工智能驱动的化学合成领域,再次取得里程碑式突破。
机器学习,解放双手
2020年作者团队开发了一款名为Allchemy的化学合成算法软件,通过算法绘制出了数千个反应途径,该算法可以生成一个完整的前生命化学的反应网络。作者进一步使用Allchemy正向合成平台从大约200种废弃化学品中生成巨大的合成网络,并从该网络组成的大约3亿个分子中识别出69种药物和98种农药,通过实验验证了其中几条路线,用可利用的废物合成的若干目标产物绝大多数步骤都为绿色路线。进一步完善反应知识库、优化代码,专家级的自动合成路径设计最终将变得完全可行。
图 Bartosz Grzybowski教授 图片来源:UNIST
关键问题
化学工业会持续的产生大量的废弃化学品,设计“循环化学”方案以有效地将这些废弃的材料选择性的转化为有用的化学品是至关重要的。尽管目前已经在某些类别的有害化学品的降解方面取得了重大进展,但“关闭循环”(将废弃基质转化为有价值的产品)的工作仍然零散并且集中在众所关注的领域。综合分析哪些有价值的产品可以从不同的化学废物中合成是困难的,因为即使是很小的一组废物基质,也可以在几个步骤内产生数百万个假定的产品,每个产品都可以通过形成紧密连接网络的多条路径进行合成。追踪所有这些合成并选择那些符合“绿色”化学标准的合成可以说是超越了化学家的认知。
新思路
有鉴于此,韩国蔚山基础科学研究所Bartosz A. Grzybowski教授等人展示了具有广泛综合知识的计算机如何帮助设计化学废物制药这一挑战。研究团队使用Allchemy正向合成平台(作者自行设计的化学合成算法软件)从商业规模回收的大约200种废弃化学品中生成巨大的合成网络,从这些网络中检索数万条大约300种重要药物和农用化学品的合成路线,并根据可持续化学指标进行算法排名。实验验证了其中几条路线并在流动化学平台上进行工业现实演示。广泛采用计算机化的废物转化为有价值产物的算法可以加快化学品的生产性再利用,这在很大程度上减少了存储或处置成本,同时也降低了对环境的危害。
技术方案
根据搜索和分析此网络的算法在短时间内设计出合成路线,同时从反应类型/类别、允许取代基范围、典型条件和试剂、建议的溶剂、温度范围等多方面对每条路线进行评价,最后综合决策最优合成路线。
1)反应规则:Allchemy中的每个转换指定了反应类型/类别、允许取代基的范围、与给定反应不兼容的结构基序、典型条件和试剂、建议的溶剂、温度范围等。
2)反应变换被迭代地应用于感兴趣的底物:每一代合成的产品只有在它们是小分子量的情况下才会保留用于进一步计算。
3)广度优先搜索算法:用于检索连接废物和有价值产品的所有合成物,通过不同的需求与相应的计算方式对所产生的合成网络给与评分,以便评价合成网络的优劣。
技术优势
1)该程序计算了一系列分子特性(logP、能量、pKa 值等)。
2)标记有问题的试剂(美国环境保护署 (EPA) 清单中的试剂)极度危险物质、欧盟 REACH 法规高度关注物质清单,并使用环境和健康标准建议“更环保”的替代品,。
3)对于每个反应,软件都会计算原子经济性或反应热等量。
技术细节
反应规则设置
Allchemy中的每个转换指定了反应类型/类别、允许取代基的范围、与给定反应不兼容的结构基序、典型条件和试剂、建议的溶剂、温度范围等。重要的是,该程序还计算一系列分子性质,对有问题的试剂和溶剂进行标记,并根据环境和健康标准建议“更绿色”的替代品。例如,烯烃环氧化中建议用硫酸氢钾代替间氯过氧苯甲酸(mCPBA),脱氧氯化用亚硫酰氯代替三苯基膦和四氯甲烷。在溶剂方面用二甲亚砜(DMSO)替代苯酚合成二甲基甲酰胺(DMF),用叔丁基乙醚代替四氢呋喃(THF)将酮还原为醇等。此外,对于每个反应该软件还可以计算原子经济或反应热等量。此外,在连续步骤中涉及相同溶剂的反应序列得到促进,而需要很低或很高温度的反应由于能量成本高而受到抑制。
图1 正向合成网络的生成与性质
反应网络构建
反应变换被迭代地应用于感兴趣的底物。尽管“化学废物”的概念有不同的含义,在这里考虑作为底物的189个小分子确定是大规模工业过程的废物副产品(图1)。在算法的最基本版本中,每一代合成产物所产生的分子都与前几代的产物和原始底物相结合并重复这个循环,直到达到用户定义的合成世代极限(图2a)。然而,由于这种方法创建的反应网络(图 2b)随着底物数量和代数的增加而迅速扩展(图 2c,d),因此将网络生成设置成偏向于高价值分子的合成。在这种方法中,每一代合成的产品只有在它们是小分子量的情况下才会保留用于进一步计算,因此可以作为后续合成的有用构建块。
图2 从废弃底物和经常使用的简单辅助分子开始的更高级药物的高级合成的例子
合成网络示例
一旦网络生成,广度优先搜索算法将用于检索连接废物和有价值产品的所有合成物,因为最短路径不一定是最优的,同时还考虑了长达两步的较长的路径。由于网络的高度互联性,一个有价值的产品通常有多种合成。在这里旨在减少一些不希望的反应条件或性质的使用,并评估整个途径结构。
第一个大规模网络是从189个废弃底物的基本集传播而来,在由这个网络组成的大约3亿个分子中该算法识别出69种药物和98种农药,表明每个目标需要1-2081次合成。然而,单独的废弃物显然缺乏合成灵活性来构建更复杂的支架。考虑到这一点,第二次计算用上述1000种基本和流行的试剂增加了废物基质的集合。使用更集中的宽度参数和更高的传播网络产生了超过1.6亿种可合成化合物的空间,包括71种药物和20种农用化学品。这些靶点在结构上比第一个网络更复杂,包括一些世界上最常用的处方药(例如,沙丁胺醇排名第7,卡维地洛排名第33,氯己定排名第286)。图3显示了根据成本函数排名靠前的一些路线,仅在少数情况下它们涉及受管制的中间体(例如,合成卡维地洛中的芳基肼,合成比索丙醇中的环氧乙烷)或程序建议没有更环保替代品的溶剂和试剂(例如,缬沙坦合成四唑环中的叠氮化物,米拉贝隆合成中的重氮甲烷)。最后考虑了一个支持特定商业操作的网络,即通过按需制药(ODP)实现药品和活性成分的分散和全自动化生产。该网络在较宽的探索宽度下产生了大约3.5亿个分子的空间,包括额外的27种药物和11种农药。特别有趣的是,ODP确定了用于COVID-19呼吸机患者急需的药物:顺阿曲库铵(一种肌肉松弛剂)、咪达唑仑(一种镇静剂)和异丙酚(一种麻醉剂)。
图3 在实验室规模的合成中对选定的计算机设计的路径进行实验验证
实验验证
利用算法在上述网络中追踪的几条路径进行了实验验证。首先进行了如图4所示的实验室规模的综合,目的仅仅是确认计算机设计方案的总体正确性。之所以选择这些例子是因为该软件提出了一些有趣的转换(例如,氨苯砜合成中的重排)或者是因为所提议的路径在几个步骤中缺乏先前的文献先例。合成通常很简单,并且在Allchemy建议的条件下以良好的产率进行。
接下来使用以废物流为原料的ODP的流动化学平台在更大规模和实际工业环境中测试了计算机规划路线的适用性。具体而言,在顺式阿曲库铵、咪达唑仑和丙泊酚等中间体的连续过程中ODP建立了隔离点以确保高产品质量(图 5a-c)。此工艺中在总摩尔数为5 mol%的香草酸和愈创木酚存在下生成酰氯衍生物,随后进行反应和分离,最终允许从工艺流中选择性提取极性更大的杂质。有了这种纯化,12小时的生产运行产生了超过1 kg的顺阿曲库铵中间体。批量实验表明,当二苯甲酮被10 mol%的硝基苯和氯苯污染时对内酰胺转化的影响最小。对于生产运行二苯甲酮与溴乙酰氯反应,经过10小时运行得到48 g乙酰胺。最后,由 4-羟基苯甲酸在异丙醇中制成了一种脂溶性麻醉剂异丙酚。通过ODP系统运行12小时生产了150 g DIHA。额外的净化单元操作如再结晶可以提高纯度。这些流程都可以满足当地医院系统的供应。
图4 在自动化、模块化的ODP平台上合成COVID-19重症监护室药物或其中间体。
展望
总而言之,作者展示了配备了全面的化学反应性规则的计算机可以快速追踪和排序前所未有的循环合成,建立工业化学废物的新的生产性用途。对特别描述的方案进行扩展和改进可以获得更准确的数据来估计过程相关指标,则要求应该对候选合成进行排序的成本函数进行更新。对描述足够广泛的酶的底物范围时应将这些生物催化转化添加到Allchemy的反应知识库中。Allchemy等应用如果在整个化学工业中得到采用和共享将是最具影响力的。例如,一些公司输入希望处理的废物基质,一些公司表示希望合成的产品,一些公司投标执行该机器计划的废物-药物合成。在执行这些任务时设想了Allchemy等软件(引导化学家找到潜在的增值机会)和 ODP 等分布式制造网络(利用当地可用的废物流快速且经济高效地部署多个生产单元)之间的协同作用。这样一个全行业的系统将有助于同步循环化学工作。
参考文献:
Bartosz A. Grzybowski et. al. Computer-designed repurposing of chemical wastes into drugs. Nature, 2022, 604:668-676
DOI: 10.1038/s41586-022-04503-9.
https://www.nature.com/articles/s41586-022-04503-9