机器学习有望解决化学领域的重大挑战,并加快研究假设的生成、改进和/或整理。尽管机器学习工作流程具有总体适用性,但存在不同的评估研究设计。当前评估技术和指标的异质性导致难以(或不可能)比较和评估新算法的相关性。最终,这可能会延迟化学的大规模数字化,并使方法开发人员、实验人员、审稿人和期刊编辑感到困惑。近日,葡萄牙里斯本大学Tiago Rodrigues等批判性地讨论了一套针对不同类型的基于机器学习的出版物的方法开发和评估指南,强调监督学习。
本文要点:
1)提供了来自不同作者和化学学科的各种示例。在考虑不同研究组的不同可及性的同时,作者建议侧重于报告完整性和工具之间的标准化比较。作者的目标是通过提出回顾/前瞻性测试清单并剖析其重要性,进一步提高机器学习透明度和可信度。
2)建议分为不同的类别——数据/代码报告;回顾性评估;与基线比较;前瞻性评估和模型解释——旨在提高三种机器学习研究类型中方法的质量、可转移性和重用性。
3)作者期望实施最低报告标准指南将有助于管理,为决策/比较提供信息,并为化学领域的重大挑战提供创新解决方案。机器学习从业者、实验化学家、审稿人和期刊编辑将齐心协力,缩小一直阻碍机器学习在化学领域进一步发展的巨大沟通鸿沟。
Andreas Bender, et al. Evaluation guidelines for machine learning tools in the chemical sciences. Nat. Rev. Chem., 2022
DOI: 10.1038/s41570-022-00391-9