白藜芦醇二维结晶过程建模与机器学习辅助多目标优化研究:从种群平衡到智能决策

【字体: 时间:2025年10月05日 来源:AIChE Journal?AIChE 4

编辑推荐:

  本文推荐一篇融合实验设计与计算建模的结晶过程优化研究。作者针对白藜芦醇(RSV)在乙醇-水体系中的冷却结晶过程,开发了二维种群平衡模型(2D-PBM),结合过程分析技术(PAT)和机器学习(ML)算法,实现了对晶体尺寸与形态的精准预测。通过多目标优化(MOO)和混合仿真框架(HSF),在保证产率(yield)和缩短批次时间(batch time)的同时,有效探索了晶体长径比(aspect ratio)与中值粒径(d50)之间的权衡关系,为药物结晶过程的数字化设计(QbDD)提供了高效、可扩展的优化策略。

  

2.1 实验方法及流程

2.1.1 材料与溶解度研究

本研究选用白藜芦醇(RSV,纯度98%)作为模型化合物,在多种溶剂中开展溶解度筛选,包括乙醇、甲醇、异丙醇等。通过Technobis Crystalline平台进行溶解度测定,最终选定乙醇-水(2:1)混合溶剂作为结晶介质。采用偏最小二乘回归(PLS-R)结合留一交叉验证(LOO-CV)建立了基于紫外光谱的浓度标定模型,覆盖290–350 nm波长范围,并使用一阶导数光谱提高灵敏度。

2.1.2 结晶实验设计与执行

实验在Mettler Toledo EasyMax 402系统进行,使用100 mL玻璃反应釜,配备三叶搅拌桨(400 rpm)、冷凝器及多种过程分析技术工具,包括EasyViewer 100、Particle Track G400和ATR-UV/Vis光谱仪。设计实验(DoE)包含6组校准实验和1组验证实验,涵盖不同冷却速率(快冷:1°C/min,慢冷:0.1°C/min)和晶种添加量(0 wt%、1 wt%、5 wt%)。所有实验均从60°C开始溶解,冷却至10°C结束,晶种在45°C时加入。

2.1.3 颗粒表征

由于RSV晶体呈棒状且易聚集,传统激光衍射法难以准确测量,本研究采用基于显微镜成像的二维尺寸测量方法。使用Nikon SMZ1500立体显微镜对至少700个晶体进行长(length)和宽(width)测量,并基于视觉评估进行颗粒分割。最终计算晶体长度和宽度分布的百分位数(PSQ10、PSQ50、PSQ90)以减小主观误差。

2.2 数学模型开发

2.2.1 过程模型与动力学方程

建立二维种群平衡方程(2D-PBE),描述晶体数量密度函数n(L,W,t)随时间及尺寸的演化。模型忽略破碎和团聚机制,仅考虑初级成核和二维生长动力学。晶体被假定为方形棱柱体,其生长速率方程引入尺寸依赖性:
  • 长度方向生长:GL = kgLgL?(1 + γL?L)
  • 宽度方向生长:GW = kgWgW
  • 初级成核:Bprim = kb?exp(-EA/RT)?σb
采用高效有限体积法(HR-FVM)求解PBE,并在CUDA C环境中实现GPU加速,单次模拟平均耗时18.2秒。

2.2.2 动力学参数辨识

通过全局优化算法(CMA-ES)最小化目标函数,该函数整合了浓度偏差、PSQ值误差及FBRM计数与模拟颗粒数的相关系数。权重因子根据实验类型(有晶种/无晶种)调整,以确保参数估值的物理合理性和窄置信区间。

2.2.3 多目标过程优化

开展两组多目标优化(MOO):
  • 场景一:最大化产率与最小化批次时间;
  • 场景二:最小化长径比(AR)与最大化d50
    优化变量包括晶种量(mseed)、冷却时间(tcool)、冷却形状参数(α)和最终温度(Tfinal)。采用NSGA-II算法求解Pareto前沿,揭示工艺参数与晶体属性间的权衡关系。

2.2.4 混合机器学习与机理仿真框架(HSF)

提出一种融合机理模型(F-P)与机器学习(ML)的混合框架:
  • 回归模型(ML-P):基于神经网络快速预测输出变量;
  • 分类模型(ML-V):评估预测结果的可靠性,过滤低置信度预测。
    该框架通过动态选择使用ML或F-P模型,大幅提升计算效率(加速比>29,000倍),同时保持预测精度。

3 结果与讨论

3.1 溶解度行为

乙醇-水(2:1)体系在10–60°C范围内溶解度符合二次多项式关系,其平衡浓度显著影响结晶驱动力(过饱和度σ)。UV/Vis-PLS模型在8个主成分下实现高精度浓度预测(R2 > 0.99)。

3.2 结晶实验分析

实验数据表明,晶体长度(100–1000 μm)变化显著,而宽度(20–50 μm)相对稳定。快冷无晶种实验(Exp.6)产生小尺寸高长径比晶体(AR≈5),而慢冷加晶种(Exp.3)获得大尺寸低长径比产品。显微镜图像证实晶体呈棒状习性,形态受冷却速率与晶种量显著影响。

3.3 参数估计结果

动力学参数估值均处于物理合理范围,长度生长参数置信区间较窄(<10%),宽度参数与成核参数不确定性较高(20–30%)。模型验证显示,浓度与长度分布预测吻合良好(误差<>

3.4 多目标优化结果

场景一优化表明,高产率(>85%)与短批次时间(<5 h)可同时实现,最优温度曲线呈凹形(α>1)。场景二揭示长径比与尺寸间的固有权衡:降低AR需牺牲d50和产率。高晶种量(5 wt%)促进小尺寸晶体形成,而低晶种量(<1 wt%)结合长冷却时间利于大晶体生长。

3.5 混合优化性能

HSF框架在MOO中实现与全机理模型一致的Pareto前沿,且计算时间从96小时缩短至9.1分钟。分类模型准确率达86.6%,有效识别不可靠预测(特异性60.3%)。通过调节过滤阈值,用户可平衡探索精度与计算效率,为实时优化与控制提供可行路径。

4 结论

本研究成功开发了白藜芦醇结晶过程的二维种群平衡模型,并通过实验校准与机器学习加速策略,实现了多目标优化与高效仿真。研究成果凸显了机理建模与数据驱动方法在制药结晶工艺开发中的协同价值,为质量源于数字化设计(QbDD)提供了实践范例。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号