基于机器学习与多重血清学数据的猴痘病毒感染与MVA疫苗接种鉴别新策略

《Nature Communications》:Machine learning-supported framework for the classification of mpox infection and MVA immunization from multiplexed serology data

【字体: 时间:2025年12月06日 来源:Nature Communications 15.7

编辑推荐:

  为解决猴痘病毒(MPXV)感染与改良安卡拉痘苗(MVA)免疫因交叉反应抗体难以区分的难题,研究人员开发了一种机器学习(ML)辅助的多重血清学检测框架。该研究通过检测15种痘病毒抗原的IgG/IgM抗体反应,利用梯度提升分类器(GBC)实现了对MPXV感染、MVA接种和未暴露血清的准确分类(特异性88%,敏感性92%),为痘病毒血清学监测提供了可扩展的高通量解决方案。

  
2022年爆发的全球性猴痘疫情再次警示世人人畜共患病的持续威胁。此次疫情由猴痘病毒(MPXV)引起,该病毒属于正痘病毒属。与已被消灭的天花病毒不同,MPXV在人群中建立了持续的传播链,尤其通过男男性行为者(MSM)群体中的性接触传播。尽管通过风险沟通、行为干预和免疫接种等措施,疫情得到控制,但猴痘仍然是公共卫生关注点,特别是刚果民主共和国流行的分支I型病毒可能具有更高的致死率。因此,开发有效的监测工具和诊断方法对于疫情防范至关重要。
血清学检测在监测感染率、发现未报告病例和无症状感染、评估疫苗接种效果等方面具有重要价值。然而,MPXV特异性血清学检测面临一个核心挑战:接种改良安卡拉痘苗(MVA)疫苗诱导的多克隆抗体反应与自然感染产生的抗体存在高度交叉反应性。这种交叉反应使得传统血清学方法难以区分免疫是来自感染还是疫苗接种。此外,童年时期接种过天花疫苗的个体会产生持久的抗体反应,进一步增加了血清学结果解读的复杂性。
为了解决这一难题,罗伯特·科赫研究所的Rebecca Surtees、Fridolin Treindl、Shakhnaz Akhmedova等研究人员在《Nature Communications》上发表了一项研究,开发了一种结合多重血清学检测和机器学习分析的新型框架,能够准确区分MPXV感染、MVA疫苗接种和未暴露个体的血清。
研究人员开发了一种基于微球的多重血清学检测方法,同时检测针对15种痘病毒抗原的IgG和IgM抗体反应。这些抗原包括来自疫苗病毒(VACV)、猴痘病毒(MPXV)和牛痘病毒(CPXV)的重组蛋白,以及病毒感染的细胞裂解物。研究纳入了两个主要的血清队列进行方法建立和机器学习模型训练:急性队列(包括PCR确认的MPXV感染急性期和早期恢复期血清、MVA疫苗接种后血清以及疫情前收集的未暴露血清)和流行病学队列(来自2023年柏林STI门诊的高风险MSM人群的血清,根据自我报告的感染和疫苗接种史分类)。此外,还使用了一个独立的验证队列来评估模型的泛化能力,该队列包括突破性感染病例(MPXV感染发生在MVA疫苗接种后)和可能有童年天花免疫史的个体。
结果
与参考检测方法的一致性
研究首先评估了多重检测法与三种标准参考方法(酶联免疫吸附试验ELISA、免疫荧光试验IFA和中和试验NT)的一致性。结果显示,多重检测法测量的抗体结合与所有三种参考方法的结果均高度相关,证实了该检测法能够可靠地反映正痘病毒特异性血清状态。
不同队列和年龄组的IgG和IgM模式比较
对抗体反应模式的分析显示,从未暴露个体到MVA接种者,再到MPXV感染者,正痘病毒特异性抗体水平呈递增趋势。在未暴露组中,推测童年接种过天花疫苗的个体对所有抗原的IgG结合均更强,表明存在预存免疫力。同样,在MVA接种和MPXV感染后,有童年天花疫苗接种史的个体也比未接种者表现出更高的IgG水平,表明存在加强效应。与急性队列相比,流行病学队列中MPXV感染后的IgG水平较低,且三个血清组之间的免疫反应差异不如急性队列明显。IgM反应在急性队列的MPXV感染者中最高,而在流行病学队列中基本缺失。
抗原特异性对IgG反应的贡献
对单个抗原的免疫反应分析发现,D8-VACV/E8-MPXV、Delta-VACV、B5-VACV/B6-MPXV和A33-VACV/A35-MPXV是整体IgG反应的最主要贡献者。虽然这些抗原能很好地区分MPXV感染与未暴露血清,但由于MVA和MPXV组之间存在显著重叠,仅凭它们不足以可靠区分MVA免疫和MPXV感染。相比之下,来自牛痘病毒的A型包涵体蛋白N端片段(ATI-N-CPXV)表现出高度独特的免疫特征,仅在MPXV感染个体中检测到显著的IgG水平,从而能将其与MVA免疫个体区分开。此外,计算同源MPXV与VACV抗原对的结合比值(如A35-MPXV/A33-VACV、B6-MPXV/B5-VACV、E8-MPXV/D8-VACV)发现,在MPXV组中对MPXV蛋白的结合更强,而在MVA和未暴露组中对VACV蛋白的结合更强,这种效应在年轻个体(40岁及以下)中更为明显。
机器学习引导分析的分类性能
研究人员训练了六种监督机器学习模型(随机森林RF、梯度提升分类器GBC、线性判别分析LDA、模糊规则分类FRBC以及两种LDA与RF/FRBC的混合模型)来进行三类分类(未暴露/MVA/MPXV)。模型使用归一化的IgG数据或IgG+IgM组合数据进行训练和评估。结果表明,在测试的算法中,GBC在结合队列(急性+流行病学)上取得了最高的整体性能(平均F1分数为0.83)。当模型在匹配的队列(训练和测试使用同一队列)上训练和测试时,性能最高;而在不匹配的队列间训练和测试时,性能显著下降。将两个队列的数据合并用于训练,恢复了模型的性能,表明增加了泛化能力。通过递归特征消除评估抗原重要性发现,即使移除多达5个抗原,对性能影响也很小。一个包含8个抗原(ATI-N-CPXV, ATI-C-CPXV, D8-VACV, E8-MPXV, A33-VACV, A35-MPXV, VACV裂解物和HEp-2裂解物)的简化组合即可达到与完整组合相当的性能。
童年疫苗接种后ML预测的特异性
分析误分类率发现,在推测有童年天花疫苗接种史的个体中,约30%的未暴露血清被GBC和LDA误分类为MVA,而随机森林(RF)的误分类率高达65%。相比之下,年轻、推测未接种的个体误分类率很低(约2%)。这表明与年龄相关的残留免疫力会影响抗体谱,增加了准确分类的难度,尤其是对RF模型。
检测性能的验证
在独立验证队列(n=143)上,GBC模型保持了稳健的性能,总体F1分数为0.70。对于MPXV感染的检测,在验证队列中显示出92%的敏感性和88%的特异性,与在结合队列中观察到的性能(敏感性86%,特异性90%)相近,表明对MPXV感染具有强大的检测能力。MVA接种血清大多被正确分类(>90%)。在未暴露组中,误分类更常见(43-60%),尤其是有童年天花疫苗接种史的老年个体,这些误分类样本大多被重新划分为MVA组,这与童年天花疫苗接种产生的残留免疫力一致。MPXV病例,包括突破性感染,大多被GBC正确分类(80%),而LDA更频繁地将这些误分类为MVA(约45%的MPXV误分类为MVA)。研究人员还尝试了一种混合集成策略,对Delta-VACV血清反应阴性的样本应用LDA,对阳性的样本应用GBC,在独立验证队列上略微提升了性能(F1=0.76),但差异不显著。引入预测置信度阈值(>0.5)过滤低置信度预测后,GBC和混合集成策略的性能在两个队列上均有所提升。
与单抗原分类器的比较
研究还将GBC模型与基于单个或少数抗原的简化分类器进行了直接比较。对于区分血清阳性与阴性,E8-MPXV是最佳单抗原,其次是B6-MPXV。而对于区分MPXV感染与MVA接种,ATI-N-CPXV和A35-MPXV/A33-VACV结合比值效果最好。然而,在所有二分类和多分类任务中,基于GBC的ML方法 consistently 优于简化的分类器。更重要的是,GBC模型表现出显著的鲁棒性,即使单独移除ATI-N-CPXV、E8-MPXV或D8-VACV,甚至同时移除ATI-N-CPXV和E8-MPXV,对分类性能的影响也微乎其微。这表明ML方法不仅性能更优,而且通过剩余抗原提供的冗余实现了更强的鲁棒性。
讨论与结论
该研究成功展示了一种将高通量多重血清学检测与机器学习相结合的新策略,能够准确区分MPXV感染、MVA疫苗接种和未暴露状态,即使在存在既往疫苗接种或突破性感染等复杂免疫背景的情况下也是如此。
与传统方法相比,该ML辅助的多重血清学检测具有明显优势。它能够利用高维血清学数据中微弱且重叠的免疫反应模式,实现单抗原方法无法达到的分辨率。关键抗原ATI-N-CPXV被确定为区分MPXV感染的关键标志物。机器学习模型,特别是GBC,能够有效处理数据中的非线性和复杂相互作用,即使在缺少关键抗原标记的情况下,也能通过剩余抗原的冗余保持可靠的分类性能。
该研究的局限性包括体液免疫反应固有的变异性可能导致分类错误,尤其是抗体水平弱或衰减的个体。童年天花免疫被确认为一个重要的混杂因素。未来工作可考虑纳入更多特异性抗原,或根据突破性感染状态和童年免疫史对模型进行显式分层。值得注意的是,研究表明仅使用8个抗原的简化组合即可保持高性能,这有助于降低检测成本。
更重要的是,该研究提出的框架具有广泛的适用性。血清学交叉反应性的挑战并非正痘病毒所独有,在黄病毒科、汉坦病毒科等其他病毒家族中也存在类似问题。这种ML辅助的多重血清学方法可以适应这些及其他背景,实现高分辨率的血清状态分类,从而为更广泛的传染病血清诊断工具提高特异性和可解释性。
总之,这项研究引入了一个集成的框架,将多重血清学与机器学习相结合,通过解析对MPXV和MVA等密切相关病毒的免疫反应,实现了传统血清学 alone 无法达到的区分能力。从更广泛的意义上看,这项工作表明,利用机器学习挖掘高维血清学数据中的潜在模式,可以为血清流行病学研究开辟新途径,显著提高其分辨能力。这种策略有望成为区分抗体免疫反应(尤其是对密切相关的病毒,如黄病毒)的蓝图,推动研究和监测从单一标志物检测向多重化、计算驱动的分析转变。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号