DNA编码库(DEL)技术是早期药物发现过程中有效鉴定新化学物质的强大平台,通过亲和选择和深度测序对大量编码小分子库进行平行筛选。虽然DEL选择为计算药物发现提供了丰富的数据集,但影响DEL数据的潜在技术因素仍不清楚。近日,犹他大学Raphael M. Franzini综述研究了影响DEL数据中化学信息的关键参数及其对命中分类和机器学习集成的影响。
本文要点:
1) 作者强调了数据处理和解释的必要性,相应的标准化方法对于基于DEL的方法成功至关重要。主要的挑战包括序列计数和结合亲和力之间的关系、频繁的攻击,以及库组成不均匀、DNA损伤和连接子等因素对结合模式的影响。
2) 实验伪影,如蛋白质固定和筛选基质效应引起的伪影,使数据解释更加复杂。此外,作者重点介绍了使用机器学习对DEL数据进行去噪和预测候选药物的最新进展。
Moreno Wichert et.al Challenges and Prospects of DNA-Encoded Library Data Interpretation Chem. Rev. 2024
DOI: 10.1021/acs.chemrev.4c00284
https://pubs.acs.org/doi/10.1021/acs.chemrev.4c00284