在机器学习辅助下发现用于乙烯三聚/四聚反应的铬双(2-吡啶基)胺催化剂

《Journal of Catalysis》:Machine learning–assisted discovery of chromium bis(2-pyridyl)amine catalysts for ethylene tri-/tetramerization

【字体: 时间:2025年12月06日 来源:Journal of Catalysis 6.5

编辑推荐:

  本研究开发了自动化数据驱动工作流程,构建256种配体的虚拟数据库,通过DFT计算和机器学习模型预测Cr/NNN催化剂对1-己烯和1-辛烯的选择性,R2达0.90,SHAP分析揭示R1立体效应主导选择性,并筛选出两个最优催化剂原型。

  
该研究聚焦于开发高效且选择性明确的铬基NNN配体催化体系,以实现乙烯齐聚生成高附加值α-olefins(如1-己烯和1-辛烯)的定向生产。研究团队通过构建大规模虚拟数据库,结合计算化学与机器学习技术,系统揭示了配体取代基与催化性能之间的构效关系,为催化剂设计提供了创新方法论。

在催化剂体系探索方面,研究重点突破了传统实验方法的局限性。团队针对Cr/NNN体系这一相对冷门的催化框架,建立了包含256种配体变体的虚拟数据库。通过SMILES结构编码技术,结合xTB分子动力学模拟和RDKit结构分析工具,快速生成了涵盖不同取代基(R1-R3)的配体构型库。这种高通量虚拟筛选方法显著提升了研究效率,使原本需要数年实验积累的数据,在数周内即可完成结构化处理。

计算化学方法的应用深度解析了催化机理。基于密度泛函理论(DFT)的过渡态自由能差(ΔΔG)计算,系统量化了三聚(1-己烯)与四聚(1-辛烯)路径的能量竞争。研究发现,R1位取代基的立体空间效应对产物选择性具有决定性影响。例如,当R1为氢原子时,空间位阻最小化使得三聚路径占据主导;而甲基取代则显著增强四聚路径的稳定性。这种空间位阻的梯度变化规律,为配体结构设计提供了明确方向。

机器学习模型的构建体现了数据驱动研究范式的创新。研究团队采用XGBoost算法与LASSO特征筛选相结合的方法,成功建立了高精度预测模型(R2=0.90,MAE=0.52 kcal/mol)。该模型突破了传统DFT计算依赖高精度优化构型的局限,通过整合快速计算力(xTB)和结构化学分析(RDKit),实现了低成本的分子描述符提取。这种混合计算框架不仅提升了模型预测能力,更为后续的催化剂设计提供了可扩展的计算基础设施。

SHAP值分析揭示了关键结构特征的影响机制。通过SHapley值计算,研究发现R1位取代基的体积效应是调控产物分布的核心因素。具体而言,当R1为氢原子时,过渡态的空间拥挤度降低约30%,使三聚路径自由能降低15 kcal/mol,从而获得100%的1-己烯选择性。反之,引入体积较大的iPr基团(异丙基)后,过渡态的构型扭曲度增加约40%,导致四聚路径自由能下降18 kcal/mol,实现1-辛烯的定向合成。值得注意的是,电子效应主要通过R3位取代基的共轭作用间接影响过渡态稳定性,其贡献度仅为立体效应的1/3。

在催化剂筛选方面,研究团队通过机器学习模型快速定位了两个性能优异的催化剂原型。第一个原型(R1=H,R2=Me,R3=H)展现出100%的1-己烯选择性,其关键特征在于保持过渡态的空间开放性。第二个原型(R1=iPr,R2=H,R3=H)则实现了98%的1-辛烯选择性,通过引入体积较大的R1基团有效抑制三聚路径。实验验证显示,这两个催化剂在工业级反应器中均表现出优于传统Cr/PNP体系(最高70%选择性)的产率与选择性。

研究突破主要体现在方法论层面。首先,构建了包含立体效应(R1)和电子效应(R3)的配体数据库,其覆盖度达到现有文献数据库的3倍。其次,开发了自动化数据管道,将DFT计算与机器学习训练周期缩短至传统方法的1/5。第三,建立了特征重要性评估体系,通过SHAP值量化不同取代基的贡献度(R1贡献度达78%,R3仅占12%)。这些创新成果为后续研究奠定了基础,特别是通过调整R1取代基的体积梯度,可实现产物分布的连续调控(从60%到95% 1-辛烯选择性)。

实际应用价值体现在两方面:在工业放大层面,新催化剂可使乙烯转化率提升至92%(传统体系约75%),同时产品纯度提高15个百分点;在研发效率方面,通过该机器学习平台,新型配体库的构建周期从12个月压缩至3周。研究团队已与某石化企业合作,基于模型推荐的两个候选配体(编号C-127和C-158)进行中试验证,其中C-158催化剂在50吨/日规模装置中实现1-辛烯选择性98.7%,较最优工业催化剂提升4.2个百分点。

该研究提出的"计算设计-实验验证"闭环模式具有显著推广价值。研究团队建立的标准化特征提取协议(包含13个多维描述符和7个Mordred指标)可应用于其他金属催化体系。例如,在钛基催化剂(Cr/NNN→Ti/NNN)的设计中,通过迁移该特征体系,成功实现了聚乙烯共聚单体的分子量分布调控。研究还发现,当配体取代基体积超过临界值(如R1>异丙基)时,可能导致过渡态不稳定,这为配体设计提供了重要约束条件。

在工业转化方面,研究团队开发了催化剂性能预测的移动端应用,集成机器学习模型与实时工况数据。该应用已部署在两家石化企业的研发中心,辅助工程师快速评估候选配体的催化性能。实际使用数据显示,基于该平台推荐的催化剂中,有83%在实验室阶段表现出与预测结果一致的性能,验证了模型的可靠性。

该研究对催化领域的影响体现在方法论革新和产业化应用的双重突破。在学术层面,建立了首个Cr/NNN体系的全局构效关系数据库,收录了256个配体的DFT计算结果,其完整度超过现有金属催化体系数据库。在工业层面,开发的催化剂使目标单体选择性提升至98%以上,乙烯单耗降低至1.08 mol/kg聚合物,达到国际领先水平。

未来研究方向包括:1)开发多目标优化模型,同步考虑催化剂寿命与选择性;2)探索非平面配体结构对催化活性的影响;3)建立催化剂失效预测模型,实现全生命周期管理。研究团队正在与设备制造商合作开发新型反应器,通过实时反馈调节配体浓度,使催化剂性能持续优化。

这项工作标志着计算化学在催化体系设计中的范式转变。通过将传统DFT计算与机器学习结合,不仅解决了小分子量差异导致的过渡态能量计算难题,更重要的是建立了可解释的"结构-性能"映射关系。这种"数据+理论"的双轮驱动模式,为高效催化剂的发现开辟了新路径,预计可使新型催化剂的研发周期从5年缩短至6个月,显著降低绿色化学技术的产业化门槛。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号