
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:从模式到预测:机器学习与抗真菌耐药性生物标志物的发现
【字体: 大 中 小 】 时间:2025年09月23日 来源:Canadian Journal of Microbiology 1.6
编辑推荐:
本综述系统探讨了机器学习(ML)在抗真菌耐药性(AFR)生物标志物发现中的革新作用。文章对比传统AFR检测方法,突出ML整合质谱(MS)、分子动力学及多组学技术的高效性,强调其通过解析复杂数据模式加速耐药标志物识别、优化诊疗策略的潜力。作者呼吁跨学科合作以推动ML驱动AFR管理,为真菌感染提供精准治疗方案。
抗真菌耐药性的全球挑战与机器学习介入契机
真菌病原体对人类健康、农业及生态系统构成重大威胁,其感染尤其在免疫缺陷人群中引发高发病率与死亡率。随着抗真菌耐药性(AFR)的日益加剧,现有治疗手段效果受限,亟需创新策略应对。传统AFR生物标志物发现依赖实验室对比与靶向突变,但存在耗时长、操作依赖性强等局限。机器学习(ML)作为人工智能的核心分支,通过分析海量数据模式,为AFR研究带来突破性进展。
抗真菌耐药性的机制与紧迫性
AFR问题在临床与环境环境中日趋严峻。抗真菌药物种类有限,主要分为三类:多烯类(破坏细胞膜固醇)、棘白菌素类(抑制1,3-β-d-葡聚糖合成)及唑类(抑制麦角固醇合成)。耐药机制包括内在耐药(如物种固有结构特性)、获得性突变(如ERG11/CYP51A基因突变)、染色体非整倍性(通过基因拷贝数变化介导耐药)以及环境选择压力(如农业唑类杀菌剂使用导致交叉耐药)。其中,唑类耐药在烟曲霉中尤为突出,TR34/L98H突变导致全球性治疗失败与死亡率上升。新兴病原体耳念珠菌(Candida auris)更呈现多药耐药特性,加剧公共卫生危机。
传统生物标志物的局限与需求
AFR生物标志物主要包括遗传、蛋白质组、代谢组与转录组四类。经典案例如烟曲霉CYP51A基因突变(G54、L98、Y121等位点)降低唑类结合力,耳念珠菌FKS基因突变导致棘白菌素耐药。Efflux pump基因(如CDR1/CDR2)过表达通过外排药物降低细胞内浓度,而代谢标志物如ERG3失活可改变固醇合成通路。分子伴侣Hsp90的稳定作用亦与多药耐受相关。然而,传统抗真菌药敏试验(AFST)需长达数日培养,且操作变量影响结果准确性,凸显快速精准检测技术的必要性。
机器学习技术概述与应用框架
机器学习分为监督学习、无监督学习、半监督学习与强化学习四大类。监督学习(如卷积神经网络、随机森林)依赖标注数据训练模型,适用于分类与回归任务;无监督学习(如PCA聚类)探索无标注数据内在结构;强化学习则通过环境反馈优化决策。在AFR研究中,监督学习主导生物标志物挖掘,而无监督学习常用于数据降维与模式可视化。
机器学习驱动的AFR生物标志物发现
质谱技术与蛋白组模式分析
基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)结合ML显著加速病原体鉴定。两种主流策略包括:复合相关性指数(CCI)统计法,通过光谱比对确定最小谱图变化浓度(MPCC),与微量肉汤稀释法MIC高度一致;以及原始光谱直接分类法,如偏最小二乘判别分析(PLS-DA)与支持向量机(SVM)区分烟曲霉耐药株准确率达88.3%–98.5%,同步识别潜在生物标志物。
分子动力学与结构特征挖掘
针对耐药靶点突变,分子动力学模拟结合ML揭示远端突变对药物结合的影响。例如,耶氏肺孢子菌二氢叶酸还原酶(pjDHFR)突变(F36C、S31F)通过破坏氢键与范德华力降低甲氧苄啶结合力。随机森林模型进一步筛选出20个关键分子特征,为唑类耐药机制提供新见解。
基因组与异质性耐药解析
ML助力基因组突变筛选与异质性耐药检测。通过对耳念珠菌逾22万突变的分析,递归特征削减与PCA鉴定出氟康唑、两性霉素B及米卡芬净耐药相关新突变,模型AUC值超0.85。逻辑回归与XGBoost模型仅需10个遗传标记即可高效预测隐球菌与近平滑念珠菌的异质性耐药,规避传统培养延迟。
代谢组与药物应激响应
拉曼光谱结合约束性ML线性模型追踪药物暴露后代谢动态。耳念珠菌经两性霉素B与5-氟胞嘧啶处理后,细胞壁脂质(麦角固醇)、多糖几丁质及核苷酸(胸苷、胞苷)含量显著变化,且5-FC诱导菌丝生长,揭示应激响应标志物。
跨耐药性预测与未来方向
化学遗传学数据结合决策树ML已成功拓展大肠杆菌抗生素交叉耐药互作网络,类似策略在 antifungal 领域的应用尚待开发。ML整合多组学数据、加速生物标志物临床转化、优化个体化治疗,将是应对AFR的核心方向。
生物通微信公众号
知名企业招聘