MHCquant2革新免疫肽组学技术,提升肿瘤抗原发现灵敏度与可及性

【字体: 时间:2025年09月24日 来源:Genome Biology 9.4

编辑推荐:

  本研究报道了新一代免疫肽组学分析流程MHCquant2,该流程整合DeepLC、MS2PIP等开源工具,通过Nextflow框架实现跨平台高通量分析,显著提升HLA肽段鉴定灵敏度达27%,新增16万余个良性组织来源肽段数据,为肿瘤免疫治疗靶点发现提供了更精准、高效的解决方案。

  

在肿瘤免疫治疗领域,准确鉴定人类白细胞抗原(HLA)呈递的肽段至关重要,这些肽段是T细胞识别和攻击肿瘤细胞的关键。然而,免疫肽组学研究一直面临重大挑战:HLA呈现的肽段丰度低、变异性高,导致质谱检测灵敏度不足;大规模数据处理对计算资源要求极高;现有分析工具在跨平台兼容性和标准化方面存在局限。虽然质谱技术不断进步,如引入捕获离子迁移谱(TIMS)与飞行时间质谱(timsTOF)联用提升了分离分辨率和检测灵敏度,但数据处理流程仍跟不上技术发展步伐。此前开发的MHCquant1流程在可扩展性方面取得进展,但在识别低丰度抗原方面仍显不足;FragPipe虽采用MSFragger搜索引擎加速鉴定,却难以部署到高性能计算环境;PEAKS管道虽通过深度学习提高灵敏度,但其闭源特性限制了大规模应用。这些瓶颈严重阻碍了肿瘤特异性抗原的发现,特别是对突变来源的新抗原(neoepitopes)和肿瘤相关抗原(TAA)的精准识别。

为突破这些限制,由Jonas Scheid、Steffen Lemke等研究人员领导的多国团队开发了MHCquant2,这是一个基于Nextflow DSL2构建的模块化、开源分析流程,已整合到nf-core框架中确保可重复性和跨平台运行能力。该研究通过系统性能测试和多重应用验证,证明了MHCquant2在提升肽段鉴定灵敏度、扩展良性参考数据库和促进肿瘤抗原发现方面的卓越性能,相关成果发表在《Genome Biology》上。

研究人员采用了几项关键技术方法:基于免疫亲和色谱从92个人类良性原代组织样本中分离HLA I类和II类分子;使用timsTOF Pro质谱仪进行数据依赖性采集(DDA)模式检测;通过MHCquant2流程整合Comet搜索引擎、Percolator重评分及OpenMS工具进行定量分析;采用MS2Rescore框架集成DeepLC和MS2PIP预测肽段保留时间和碎片离子强度;利用NetMHCpan 4.1进行HLA结合亲和力预测。样本来源于苏黎世大学医院尸检获得的良性实体组织,经病理学家鉴定后速冻保存。

Peptide property predictors boost the identification and quantification of low-abundant HLA ligands in MHCquant2

研究人员首先使用HLA Ligand Atlas数据集对MHCquant2进行基准测试。与MHCquant1相比,MHCquant2将HLA I类结合肽和II类肽的独特鉴定数量分别提高了26.9%和13.0%。每个样本的HLA I类结合肽鉴定中位数从1159个增加到1644个,II类肽从2051个增加到2419个。DeepLC和MS2PIP的组合被确定为识别率提升的主要来源。特别值得注意的是,MHCquant2独占的HLA I类和II类结合肽的中位强度分别比共享肽段低3.4倍和2.1倍,表明MHCquant2能够有效识别低丰度肽段。特征权重分析显示,MS2PIP的特征贡献权重最高(N=71),其次是Comet(N=12)和DeepLC(N=6),表明每种预测器都为肽段鉴定提供了独特价值。

MHCquant2 outperforms FragPipe and PEAKS on a novel benignMHCquant2 dataset

研究人员创建了一个新型良性HLA免疫肽组数据集(benignMHCquant2),包含92个人类原代组织样本的免疫肽组数据。使用改进的timsTOF2024 MS2PIP模型,在该数据集中共鉴定到133,163个HLA I类结合肽和204,291个HLA II类肽。该数据集覆盖了99.6%世界人群的HLA I类等位基因和100%世界人群的HLA II类等位基因。特别重要的是,研究发现单电荷离子占HLA呈现肽的相当大比例(30.5%),而TIMS技术能够基于电荷状态和碰撞横截面更好地分离这些肽段,使得单电荷肽段的鉴定纯度达到87.6%,远高于其他电荷状态。

在与FragPipe和PEAKS的对比中,MHCquant2在HLA I类结合肽鉴定数量上分别比FragPipe和PEAKS高出13.2%和2.8%,在II类肽上分别高出5.1%和1.6%。MHCquant2独占的肽段中含有70.9%的预测强结合剂(SB),远高于FragPipe(56.9%)和PEAKS(60.2%),且这些肽段显示出更低的NetMHCpan百分位等级,表明其具有更高的HLA结合亲和力。

MHCquant2 expands and refines tumor antigen discovery

为展示MHCquant2在肿瘤抗原发现中的应用潜力,研究人员将benignMHCquant2数据集与此前已发表的良性免疫肽组数据集结合,构建了一个包含420个HLA I类样本(213,462个独特HLA结合肽)和415个HLA II类样本(423,438个肽)的综合性良性参考数据库。benignMHCquant2数据集为该参考库贡献了43,518个新的HLA I类结合肽和125,380个新的II类肽,极大扩展了多种组织(如骨髓、胃和甲状腺)的良性参考数据。

通过对急性髓系白血病(AML)、慢性淋巴细胞白血病(CLL)和卵巢癌(OvCa)已发表数据集的重新分析,研究发现扩展的良性参考数据库能够排除大量先前认为的肿瘤相关抗原(TAA)。在AML中,40.2%已发表的TAA被良性参考数据库排除;在CLL和OvCa中,MHCquant2分别新发现了69.9%和26.5%的独占TAA。更重要的是,MHCquant2提高了61.2%的CLL TAA和61.7%的AML TAA的肽段频率。

在识别低丰度突变来源的新抗原方面,MHCquant2重新分析黑色素瘤数据集后,比MHCquant1多鉴定出6个新抗原,其中大部分集中在低丰度范围(结合阈值<2)。通过合成肽段验证,其中4个新抗原得到了实验证实。

讨论与结论

本研究开发的MHCquant2代表了免疫肽组学分析流程的重大进步,通过整合DeepLC和MS2PIP等肽段属性预测器,显著提高了HLA呈现肽的鉴定灵敏度,特别是对低丰度肽段的检测能力。作为nf-core框架的一部分,MHCquant2确保了分析流程的可重复性、可移植性和长期可维护性,有利于在科学研究中的广泛采用。

该研究的首要应用是构建了迄今为止最全面的良性免疫肽组参考数据库,新增超过160,000个HLA I类和II类呈现肽,极大扩展了HLA等位型和组织来源的覆盖范围。这一资源对于精准识别肿瘤独占抗原、避免免疫治疗中的"on-target-off-tumor"不良反应具有重要意义。

在实际应用层面,MHCquant2不仅能够精炼先前研究中发现的肿瘤相关抗原,还能识别新型高频肿瘤独占肽抗原和低丰度突变来源的新抗原。对黑色素瘤数据的重新分析证明,MHCquant2能够发现之前未被检测到的天然呈现的新抗原,这为突变负荷较低的肿瘤类型的免疫治疗靶点发现提供了新的可能性。

值得注意的是,MHCquant2的开源特性和模块化设计允许未来轻松集成更多先进工具,如离子迁移率预测器IM2Deep和de novo搜索引擎Casanovo,这将进一步提升免疫肽组学分析的灵敏度和发展潜力。

总之,MHCquant2作为一个敏感、可扩展的开源管道,为高通量鉴定和定量HLA呈现肽提供了强大工具,其应用将推动癌症免疫治疗和其他领域的靶点发现研究。该管道已通过GitHub和Zenodo平台公开提供,采用MIT许可证,便于全球研究社区使用和进一步开发。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号