特别说明:本文由学研汇技术中心原创撰写,旨在分享相关科研知识。因学识有限,难免有所疏漏和错误,请读者批判性阅读,也恳请大方之家批评指正。
原创丨彤心未泯(学研汇 技术中心)
编辑丨风云
研究背景
具有特定性能的材料不断地被探究和开发,以推动各种技术的快速发展。由于材料的组合实际上是无限的,因此,在传统合金的情况下,它们通常由一个主金属元素和其他元素组成。最近,研究人员开始尝试寻找具有多种主要元素的合金。这种合金被称为高熵合金(HEA),极大地拓展了合金材料的设计空间。
通过使用合金的现有数据进行机器学习,可以预测合金中元素及其集体性质之间的复杂关系。例如,根据机器学习的编程方式和使用的数据类型,可以预测给定合金成分时的热膨胀系数。
关键问题
虽然高熵合金具有极大的发展前景,但开发过程仍存在以下问题:
1、基于元素组合的新材料是无限的,人工开发费时费力
材料科学家在寻找材料时,往往依赖经验而非基础物理,而不是完全理解根据材料成分决定材料性质的复杂科学,这使得开发过程冗长且繁琐。
2、机器学习虽然可以预测材料性质,但是受限于可用数据
机器学习可以有效地根据材料的组成预测材料的性质,并减少合成和测试材料所需的时间。然而,机器学习方法的质量受到可用数据的限制,特别是HEA的现有数据较少。
3、主动学习方法受限于低维数据,需多次迭代
用于指导材料实验发现的主动学习方法依赖于简单的替代模型和贝叶斯优化方法,这些方法仅限于低维数据,因此只有经过多次迭代才能显示性能改进。
新思路
有鉴于此,德国马普研究所Dierk Raabe等人提出了一种基于物理的机器学习方法,用于在巨大的铁钴镍铬(Fe–Co–Ni–Cr)和铁钴镍铬铜(Fe-Co–镍–Cr–Cu)组成空间内筛选热膨胀系数较低的合金。作者将机器学习与密度泛函理论、热力学计算和实验相结合,从数百万种复合物中筛选了17种新合金,确定了两种热膨胀系数极低的高熵因瓦合金。这些材料随着温度变化膨胀和收缩都很小,因此对于要求部件具有高尺寸稳定性的精密仪器来说,它们很有价值。
技术方案:
1、开发了一种基于生成模型的HEA合金设计方法
主动学习框架包括三个主要步骤:目标生成、物理信息筛选和实验反馈。考虑到HEA的大量可能成分组合和小型实验数据集,,作者开发了一种基于生成模型(GM)的HEA生成合金设计(HEA-GAD)方法。
2、使用两阶段集合回归模型(TERM)研究热膨胀系数(TEC)
作者通过TERM,根据物理性能测量系统测定了前三种候选材料的TEC值,并为下一个主动学习迭代增加数据。
3、设计了不同的HEA,展示了组合潜在空间分布
作者通过设计了迭代的HEA,展示了迭代的WAE潜在空间,表明了合金成分差异以及合金之间的平稳过渡。
4、构建了物理-描述符-信息模型,证实了描述符的重要作用
作者证明了物理描述符和实验TEC之间的相关性,证明了物理描述信息模型可以比仅基于成分的模型实现更好的精度。
5、展示了学习曲线和热膨胀行为,证实了模型的高精度
作者展示了模型中发现的TEC,通过模拟和实验相比较,证实了HEA-GAD-TERM经过三次迭代就能取得高精度预测。
技术优势:
1、实现了从数百万个可能的复合物中筛选目标材料
作者从数百万个可能的复合物中发现了17个Invar HEA(其中包含0到10 0%的数据段和1%的数据段),并且可以通过后续循环识别更多的Invar HEAs。
2、发现了17中热膨胀系数小于当前记录的Invar合金
作者发现的17种因瓦合金的热膨胀系数均小于HEA的当前已知记录(~10–5 K–1)。因瓦HEAs使得找到具有其他优越性能的因瓦合金成为可能,如高强度和良好延展性。
3、较少的迭代次数即可获得高精度预测
作者通过对比模拟和实验结果,证实了HEA-GAD-TERM的快速收敛,仅经过三次迭代就能高精度预测TEC。
技术细节
合金设计
首先,HEA-GAD使用GM、数学建模和采样对潜在的因瓦合金进行大规模搜索。根据评估指标,对不同的GM进行比较和分析。结果表明,Wasserstein自动编码器(WAE)体系结构比具有类似体系结构的其他模型性能更好。编码器将合金成分作为输入,并学习将其压缩为低维表示,然后解码器可以充当生成合金成分的生成器。
图 方法概述
两阶段集合回归
基于合成的回归模型,实现快速大规模的合成推理。然后,筛选HEA-GAD模型中TEC可能较低的前1000个结果,并进入第二阶段模型。设计了一个兰科德策略,允许按照特定的顺序对预测进行重新排列和排序。基于排名确保了候选人的选择不受模型不精确性的影响,并提供了一种将模型预测与不确定性相结合的系统方法。最后,通过物理性能测量系统实验测定了前三种候选材料的TEC值。然后,这些实验结果将为下一个主动学习迭代增加训练数据库。
图 HEA-GAD生成的第一次和最后一次(第六次)迭代
组合潜在空间分布
作者重点设计了前三个迭代的FeNiCoCr HEA,以及最后三个迭代中的FeNiCoCrCu HEA。作者展示了第一次迭代的WAE潜在空间和GMM建模的二维概率密度。潜在空间表明了成分差异。此外,还可以观察到Fe-Ni、Ni-Co二元合金和Fe-Ni-Co三元合金之间的平稳过渡。
图 物理信息描述符的重要性
物理-描述符-信息模型
作者用DFT和CALPHAD证明了FeCoNi合金的ws/Tc和实验TEC之间的相关性。计算了退火温度的ws/Tc,并得出了TEC值。因此,ws和Tc是有用的描述符,可以用来提高TERM的准确性。作者展示了使用和不使用描述符Tc的模型的比较,在包含DFT和CALPHAD数据后,最终测试误差从0.19显著降低至0.14,这有力地证明了物理描述信息模型可以比仅基于成分的模型实现更好的精度。
图 主动学习循环中六次迭代后的结果分析
学习曲线和热膨胀行为
作者给出了在六次迭代中实验测量的17种合金的TEC值的测量值和预测值,证实了该方法发发现率比单独使用试错法高五倍。在两个场景中演示了合金发现过程。在理想情况下,合成TEC曲线简单且凸起,这意味着该特定关系易于学习。即使存在一个小数据集,也可以很容易地找到全局最大值。作者通过绘制观察到的TEC曲线说明两个HEA中的发现路径。
图 ML设计HEA的特性总结
展望
总之,作者开发了一种快速、自动发现具有最佳热、磁和电性能的高熵合金的方法。该方法证明了它在使用非常稀疏的实验数据设计高熵因瓦合金方面的能力。与传统的合金设计方法相比,整个工作流程只需要几个月。在HEA的组成谱中,可以使用GAD-TERM框架同时优化多个属性。作者主要考虑了热膨胀系数,这与合金成分有着相对直接的关系。然而,对于机械性能,如强度和延展性,可能很难用这种方法预测,因为它们更多地取决于合金的微观结构。微观结构由合金制造过程中的成分和加工因素决定,例如,热处理的温度和持续时间,以及材料的轧制或锻造。作者尚未考虑对微观结构的处理,微观结构与性能之间的关系仍然是机器学习中构建具有目标力学性能的合金的一个缺失环节。
参考文献:
QING-MIAO HU, et al. The endless search for better alloys. Science, 2022, 378(6615):26-27.
DOI: 10.1126/science.ade5503.
https://www.science.org/doi/10.1126/science.ade5503
ZIYUAN RAO, et al. Machine learning–enabled high-entropy alloy discovery. Science, 2022, 378(6615):78-85.
DOI: 10.1126/science.abo4940.
https://www.science.org/doi/10.1126/science.abo4940