Nature Communications:基于迭代字符串编辑模型的逆合成预测
吴宗涵 吴宗涵 2024-07-31

image.png

逆向合成是药物发现和有机合成中的一项关键任务,人工智能(AI)越来越多地被用来加快这一过程。然而,现有的方法采用逐个令牌的解码方法将目标分子串转换为相应的前体,表现出不甚理想的性能和有限的多样性。由于化学反应通常会引起局部分子变化,反应物和产物通常会明显重叠。鉴于此,来自浙江大学Huajun ChenTingjun HouQiang Zhang等人提出将单步逆向合成预测重新定义为分子串编辑任务,迭代地细化目标分子串以生成前体化合物。

文章要点:

1) 该研究开发的这种方法涉及一种基于片段的生成编辑模型,该模型使用显式的序列编辑操作,并且,该研究设计了一个具有重新定位采样和序列增强的推理模块,以提高预测精度和多样性;

2) 此外,研究还通过大量实验证明,这一模型生成了高质量和多样化的结果,在标准基准数据集USPTO-50 K上实现了60.8%的top-1准确率,取得了卓越的性能。

参考资料:

Han, Y., Xu, X., Hsieh, CY. et al. Retrosynthesis prediction with an iterative string editing model. Nat Commun 15, 6404 (2024).

10.1038/s41467-024-50617-1

https://doi.org/10.1038/s41467-024-50617-1


加载更多
322

版权声明:

1) 本文仅代表原作者观点,不代表本平台立场,请批判性阅读! 2) 本文内容若存在版权问题,请联系我们及时处理。 3) 除特别说明,本文版权归纳米人工作室所有,翻版必究!
吴宗涵

最新纳米科学前言

发布文章:866篇 阅读次数:493092
纳米人
你好测试
copryright 2016 纳米人 闽ICP备16031428号-1

关注公众号