韩国首尔大学Yousung Jung、福特汉姆大学Joshua Schrier等报道机器学习能否应用预测水热合成的晶体结构,并且解释这些预测结果。
本文要点:
(1)
通过在人类可读的目标晶体结构的文本描述上训练微调大语言模型(LLM)达到与之前定制的卷积图神经网络方法相当的水平。但是,通过文本嵌入表示(text-embedding representation of the structure)上训练一个正的未标记学习模型(positive-unlabeled learning model),可以实现更好的预测质量。
(2)
使用基于LLM的工作流,为控制可综合性的因素类型生成人类可读的解释,提取其中物理规则,并评估这些规则的准确性。这些解释可以指导化学家修改或优化不可合成的假设结构,使其在材料设计中更可行。
参考文献
Seongmin Kim, Joshua Schrier, Yousung Jung, Explainable Synthesizability Prediction of Inorganic Crystal Polymorphs using Large Language Models, Angew. Chem. Int. Ed. 2025
DOI: 10.1002/anie.202423950
https://onlinelibrary.wiley.com/doi/full/10.1002/anie.202423950