《Materials Today Physics》:A Physics-Informed Machine Learning Framework for Unified Prediction of Superconducting Transition Temperatures
编辑推荐:
超导体Tc预测与分类的物理信息机器学习框架SuperConNet。基于17,820种实验数据,融合33个量子力学物理描述符(如CuO2层、Fe层间距、电子浓度等),构建了四类超导体分类模型(准确率99.94%)和Tc回归模型(优于BCS理论和DFT方法)。通过SHAP分析揭示配对机制,DFT交叉验证确认物理合理性,为高温超导体搜索提供新范式。
Ehsan Alibagheri | Mohammad Sandoghchi | Alireza Seyfi | Mohammad Khazaei | S. Mehdi Vaez Allaei
量子物理与物质学院,基础科学研究所(IPM),德黑兰 19538-33511,伊朗
摘要
超导材料在量子技术和能源系统中具有巨大的潜力。然而,它们的发现受到传统计算方法复杂性和现有机器学习(ML)模型范围有限的阻碍。我们提出了一个基于物理原理(PI)的机器学习框架,能够预测所有超导家族(包括传统和非传统超导材料)的临界转变温度(Tc)。通过设计33个量子力学相关的描述符(例如铜氧化物CuO2层、铁基系统的Fe层间距以及传统超导体的电子浓度等),我们的“SuperConNet”分类器在超导体分类和Tc预测方面实现了接近完美的99.94%准确率。该模型基于17,820种已知超导体数据进行训练,并针对无机晶体结构数据库(ICSD)中的未知材料进行了验证,在速度和通用性方面均优于BCS理论和密度泛函理论(DFT)。重要的是,SHAP分析揭示了这些描述符如何隔离配对机制,而DFT交叉验证则证实了其物理合理性。这项工作将材料化学与量子物理学相结合,扩展了对高Tc超导材料的探索范围,超越了传统的材料类别限制。
章节摘录
引言
近几十年来,超导性已成为材料科学和物理学中的一个重要课题。[1] 由于其独特的性质,超导材料在先进技术中发挥着关键作用,[2],[3] 包括电子元件、[4] 量子计算、[5],[6],[7],[8],[9],[10] 以及传感设备。[12],[13],[14] 然而,这一领域的一个重大挑战是识别具有高临界转变温度(Tc)的材料。目前,研究主要集中在...
数据准备
本研究使用两个主要数据集来构建和测试我们的机器学习模型。首先,我们从SuperCon数据库中获取了数据,[80] 该数据库最初包含约21,200种超导材料。我们通过以下步骤仔细清理了这些数据:1) 删除化学公式不明确的条目(如通用的“铜氧化物”标签);2) 排除高压氢化物(富含氢且Tc > 30 K的化合物);3) 过滤掉定义不明确的条目。最终我们得到了17,820种经过验证的超导材料。
机器学习工作流程
我们预测合成超导材料的方法分为两个阶段:首先将ICSD中的材料分类到不同的类别中,然后预测它们的临界转变温度。我们分析了大约17,820条实验记录,将其分为四类:8,540种铜氧化物基材料、296种简单的铁基(Fe-si)化合物、113种复杂的铁基(Fe-co)系统以及8,871种其他非传统超导材料。
机器学习训练
对于预测超导转变温度(Tc)的回归任务,我们采用了三种方法:Random Forest利用决策树的自助聚合来稳健地建模特征交互;XGBoost通过顺序误差校正实现梯度提升以提高预测准确性;TabNet则利用基于注意力的神经网络进行可解释的特征选择。对于超导家族的分类,我们开发了SuperConNet这一新颖的自定义模型。
CRediT作者贡献声明
Ehsan Alibagheri:撰写 – 审稿与编辑、撰写原始草稿、可视化、验证、监督、资源管理、方法论设计、研究实施、数据分析、数据整理、概念构建。
Alireza Seyfi:撰写原始草稿、数据整理。
Mohammad Sandoghchi:审稿与编辑、研究实施、数据分析。
S. Mehdi Vaez Allaei:监督、软件开发、项目管理、撰写 – 审稿与编辑。
Mohammad Khazaei:撰写 – 审稿与...
数据可用性
支持本研究结果的数据可在本文的补充材料中找到。其中包含分为四类的SuperCon训练数据集以及预测的ICSD结果。
资助
作者未获得任何与本研究、作者身份及/或文章发表相关的财务支持。
利益冲突声明
? 作者声明他们没有已知的可能影响本文工作的财务利益冲突或个人关系。
致谢
E.A. 感谢德黑兰大学物理系高性能计算(HPC)中心提供的计算资源。