人工智能高通量预测构建数据集增强杂化卤化物钙钛矿带隙可解释性研究

【字体: 时间:2025年06月10日 来源:Journal of Energy Chemistry 14

编辑推荐:

  【编辑推荐】针对传统钙钛矿带隙测定方法耗时耗能的问题,研究人员通过构建AI集成模型(含AB/KNN分类器和KNN回归器,F1分数达0.9125/0.925,MSE为0.0014 eV),开发了基于高通量预测的带隙数据集,并结合偏依赖分析(PDA)和遗传编程符号回归(GPSR)技术(R2 =0.8417),揭示了边界效应和弓形效应等关键机制,为钙钛矿光伏材料设计提供了高效可靠的新范式。

  

在能源材料领域,杂化卤化物钙钛矿(ABX3
)因其优异的光电性能成为新一代光伏材料的明星选手。这类材料的带隙(bandgap)如同控制光能转化的"闸门",直接决定了太阳能电池的效率上限。然而传统带隙测定手段却面临两难困境:紫外-可见光谱(UV-vis)需要制备特定薄膜样品,密度泛函理论(DFT)计算又消耗大量算力,两者都难以快速捕捉成分变化对带隙的影响规律。更棘手的是,现有人工智能预测模型多聚焦元素替换而非比例调控,且缺乏直观的机制解释工具,使得材料优化如同"盲人摸象"。

针对这些挑战,来自韩国的研究团队在《Journal of Energy Chemistry》发表了一项突破性研究。他们巧妙地将人工智能高通量预测与创新性解释方法相结合,不仅实现了钙钛矿带隙的精准预测,更绘制出影响机制的"全景地图"。研究团队首先构建了包含799组数据的训练集,通过特征工程筛选出关键描述符,继而搭建了由自适应提升树(AB)分类器、K近邻(KNN)分类器和KNN回归器组成的AI集成模型。这个"智能三重奏"表现出色:两个分类器的F1分数分别达到0.9125和0.925,回归器的均方误差仅0.0014 eV。基于此模型,研究者对未知成分空间进行高通量预测,构建了高质量的带隙数据集。

为破解AI"黑箱",团队创新性地开发了偏依赖分析(PDA)方法。该方法通过固定其他变量、系统扫描目标描述符,生成直观的二维热图(PDM),其分辨率远超传统实验数据绘制的等高线图。结合遗传编程符号回归(GPSR)技术,团队还推导出R2
达0.8417的数学表达式。这些创新方法相互验证:PDA结果与SHAP分析、GPSR模型及15组实验数据高度吻合,形成了完整的解释闭环。

研究结果部分揭示了多项重要发现:

  1. AI模型构建:通过对比RF、AB、MLP等算法,最终选择AB+KNN组合的集成策略,其预测精度较单模型提升30%以上。
  2. 机制解析突破:PDA热图清晰展现出Cs+
    /FA+
    比例变化引发的"边界效应",以及卤素离子混合导致的"弓形效应",这些非线性关系难以通过经验推测发现。
  3. 实验验证:制备的15组钙钛矿薄膜测试数据与预测值偏差小于0.02 eV,证实了数据集的可靠性。

在结论部分,研究者强调这项工作实现了"预测-解释"的双重突破:AI集成模型将带隙预测效率提升两个数量级,而PDA与GPSR的组合为材料设计提供了"可视化导航"。特别是发现的成分-带构效关系,可直接指导实验团队避开低效的"试错法",快速锁定最佳配方区间。该研究不仅适用于经典ABX3
体系(Cs+
/MA+
/FA+
;Pb2+
/Sn2+
;Br?
/I?
),其方法论还可拓展至其他功能材料的智能设计。

这项研究由中国国家留学基金委(202408260048)和韩国国家研究基金会(RS-2023-00259096)共同资助,Wenning Chen作为第一作者完成了模型构建与机制解析的核心工作。论文展现的"AI预测+机理挖掘"研究范式,为钙钛矿及其他能源材料的理性设计开辟了新航道。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号