多组学分析揭示CTSW在乳腺癌中的预后价值与免疫调节作用:从基因表达、单细胞图谱到表观遗传调控的深度探索

【字体: 时间:2025年09月28日 来源:Discover Oncology 2.9

编辑推荐:

  本研究针对乳腺癌异质性高、缺乏有效生物标志物的难题,通过整合转录组、甲基化、数量性状位点和全基因组关联分析等多组学数据,系统探讨了半胱氨酸蛋白酶家族在乳腺癌中的调控作用。研究发现CTSW基因表达与患者生存率显著相关,并通过孟德尔随机化验证其与乳腺癌风险的因果关联。单细胞测序分析揭示CTSW在活化CD8+T细胞中特异性高表达,尤其在TNBC亚型中表现突出,表明其可作为反映T细胞功能状态的标志物。该研究为乳腺癌免疫治疗提供了新的生物标志物和潜在治疗靶点,具有重要的临床转化价值。

  
乳腺癌作为全球发病率最高的恶性肿瘤,正面临着日益严峻的防治挑战。预计到2040年,全球每年新发病例将超过300万例。这种疾病的复杂性不仅体现在其高发病率,更在于其显著的生物学异质性。根据经典的分子分型,乳腺癌可分为Luminal A、Luminal B、HER2富集型和基底样型等多种亚型,而临床实践中则常根据组织学和分子特征将其分为激素受体阳性(HR+)、HER2+和三重阴性乳腺癌(TNBC)。其中,TNBC约占所有乳腺癌病例的15%,由于缺乏有效的靶向治疗方法,成为临床治疗中最具挑战性的亚型。
尽管多组学技术的快速发展为理解乳腺癌生物学特性和异质性提供了宝贵见解,但晚期疾病的有效系统治疗仍然有限。许多新兴疗法缺乏可靠的预测生物标志物,这不仅影响治疗效果,还可能导致治疗机会的错过或过度治疗。因此,迫切需要开发系统性的方法来从海量基因组数据中识别和优先考虑候选分子,为后续的实验验证和临床转化提供坚实基础。
在这项发表于《Discover Oncology》的研究中,Liu等研究人员将目光投向了半胱氨酸蛋白酶家族。这类使用半胱氨酸残基作为活性位点的蛋白水解酶,在调节细胞死亡、炎症和细胞焦亡等多种生物学过程中发挥着不可或缺的作用。值得注意的是,它们在免疫调节、凋亡和坏死性细胞死亡中扮演着关键角色。然而,尽管对单个半胱氨酸蛋白酶在各种生物学背景中进行了广泛研究,但对该基因家族在乳腺癌复杂生态系统中的表达特征、预后意义和免疫调节作用的系统评估仍然明显缺乏。
为了解决这一知识空白,研究人员采用了一种全面的计算机模拟方法,整合了转录组数据、数量性状位点(QTL)数据、全基因组关联研究(GWAS)数据、DNA甲基化数据和单细胞RNA测序(scRNA-seq)数据。研究的主要目标不是建立明确的机制,而是系统筛选半胱氨酸蛋白酶家族,识别与临床结果和免疫调节相关的高置信度候选基因,并构建关于其功能的稳健的数据驱动假设。
研究团队采用了多种关键技术方法开展此项研究。他们从TCGA-BRCA数据库获取了乳腺癌的转录组和DNA甲基化数据,利用limma、DESeq2和edgeR等R包进行差异表达基因分析。通过单变量和多变量Cox回归分析评估基因的预后价值,并采用Kaplan-Meier生存分析比较高低表达组之间的生存差异。孟德尔随机化(MR)分析用于推断基因表达与乳腺癌风险之间的潜在因果关系,包括基于摘要数据的孟德尔随机化(SMR)和两样本孟德尔随机化(TSMR)。功能富集分析使用clusterProfiler和org.Hs.eg.db包进行GO和KEGG通路分析。免疫细胞浸润分析采用CIBERSORT算法估计22种免疫细胞类型的比例,并使用ESTIMATE算法计算基质、免疫和综合评分。单细胞RNA测序数据通过Seurat R包进行预处理和分析,包括细胞聚类、注释和差异表达基因识别。DNA甲基化分析探讨了CTSW表达与DNA甲基化之间的关系,包括启动子和基因体甲基化对转录表达的影响。
3.1 关键半胱氨酸蛋白酶相关基因的筛选
研究从GeneCards数据库检索到182个半胱氨酸蛋白酶相关基因,通过对TCGA BRCA RNA-seq数据进行差异表达分析,使用三种独立方法识别出820个差异表达基因(DEGs)。这些DEGs与GeneCards中的半胱氨酸蛋白酶相关基因交叉参考后,最终确定了7个候选基因。单变量Cox回归分析显示3个与生存相关的基因:MMP9、CST1和CTSW。多变量Cox回归分析进一步将MMP9、CST1和CTSW确定为乳腺癌的独立预后标志物。
对TCGA-BRCA数据集的分析显示,癌组织中CTSW表达显著低于正常组织。基于这三个基因高低表达组的生存分析表明,CTSW表达与患者生存显著相关,高表达与更好的预后相关。使用"Breast Cancer Gene-Expression Miner v5.1"工具进一步验证了CTSW的预后价值,该工具包含整合RNA-seq和DNA微阵列平台的更大数据集。
为了评估CTSW表达与乳腺癌之间的因果关系,研究使用来自三个来源的eQTL数据进行SMR分析:两个血液来源的数据集和正常乳腺组织数据集。虽然CTSW的风险比值(HR值)在所有数据集中始终小于1,但HEIDI测试表明存在多效性的可能性。为了缓解这一问题,在相同假设下进行了TSMR分析。多个MR模型的敏感性分析证实了结果的稳健性,所有模型都显示保护效应(HR<1),且至少两个模型达到统计学显著性。
3.2 CTSW表达与乳腺癌免疫微环境和药物治疗的相关性
对CTSW高表达和低表达组之间DEGs的功能富集分析显示,这些基因显著参与免疫调节和细胞死亡通路。GO分析突出了T细胞活化、分化和增殖等过程,以及调节白细胞凋亡和细胞毒性的通路。KEGG分析确定了关键的免疫信号通路,包括T细胞受体信号和细胞因子相关通路,如JAK-STAT信号。此外,还富集了铁死亡、坏死性凋亡和TGF-β信号等细胞死亡相关通路。
在进一步表征肿瘤微环境(TME)时,使用CIBERSORT评估了BRCA队列中22种TIC类型的分布。在CTSW高表达和低表达组之间观察到免疫细胞丰度的显著差异。高表达队列显示多种免疫细胞类型水平升高,包括初始B细胞、M1巨噬细胞、活化和静止CD4记忆T细胞、CD8 T细胞、滤泡辅助T细胞和调节性T细胞。相比之下,低表达组显示活化和静止树突状细胞、嗜酸性粒细胞、M0巨噬细胞和M2巨噬细胞富集。
使用ESTIMATE算法计算基质、免疫和ESTIMATE评分,结果显示高表达人群的基质评分、免疫评分和ESTIMATE评分相比低表达组 statistically显著升高。研究还扩展到免疫检查点标记的检查,这些标记已被确定为免疫抑制的潜在指标。在四个类别中,高CTSW表达组始终显示比低表达组更高的标记水平,最显著的差异出现在程序性细胞死亡蛋白1(PD-1)和细胞毒性T淋巴细胞相关蛋白4(CTLA-4)双阳性组。
最后,预测药物反应以探索乳腺癌的潜在药物治疗选择。基于IC50值分析,高表达组对拉帕替尼和阿法替尼更敏感,而低表达组对奥拉帕利和来那替尼更敏感。
研究调查了CTSW与免疫检查点之间的相关性,显示CTSW与大多数免疫检查点呈统计学显著正相关。超过一半的相关性系数超过0.5,其中CD96显示最显著的关联和最高的相关系数(R>0.8)。接下来检查了CTSW与免疫细胞类型的相关性,发现超过一半的免疫细胞显示超过0.5的相关性。特别是1型辅助T细胞、未成熟树突状细胞、效应记忆CD8+T细胞、活化CD8+T细胞和活化B细胞显示相关系数超过0.7。其中,活化CD8+T细胞与CTSW表现出最稳健的相关性(R>0.8)。
3.3 通过单细胞分析揭示CTSW表达和免疫细胞模式在不同乳腺癌亚型中的分布
为了进一步研究HR+、HER2+和TNBC亚型的细胞异质性,研究人员分析了GSE261774和GSE176078数据集的scRNA-seq数据。在GSE261774中,选择七个主要成分(PCs)进行聚类,产生18个不同的细胞簇。使用SingleR进行初始注释识别出七种主要细胞类型,包括T细胞、巨噬细胞、单核细胞、B细胞、上皮细胞、癌症干细胞和内皮细胞。使用CellMarker数据库和文献定义标记重新注释将这些簇细分为10种不同的细胞类型,包括活化CD8+T细胞、M2巨噬细胞、NK细胞和耗竭CD4+T细胞。
差异表达分析显示,CTSW主要在活化CD8+T细胞中富集。在GSE176078数据集中也观察到类似模式,差异表达分析再次证实CTSW在活化CD8+T细胞中显著富集。
当可视化不同乳腺癌亚型细胞的比例时,在两个数据集中观察到相似的模式。在GSE261774中,B细胞主要在HR+中富集,M2巨噬细胞在HER2+中富集,活化CD8+T细胞在TNBC中富集。在GSE176078中也观察到类似模式,内皮细胞在HR+中富集,M2巨噬细胞在HER2+中富集,活化CD8+T细胞在TNBC中富集。跨两个数据集,M2巨噬细胞始终在HER2+亚型中富集,而活化CD8+T细胞在TNBC中富集。重要的是,CTSW在两个数据集中始终在活化CD8+T细胞中富集。
为了进一步确定在TNBC中观察到的CTSW表达升高是否仅仅反映了肿瘤浸润淋巴细胞(TIL)丰度的增加,还是代表了CD8+T细胞内的特异性上调,研究人员对单细胞RNA-seq数据进行了重点分析。当将分析限制在所有亚型的活化CD8+T细胞时,发现TNBC中每个细胞的CTSW表达水平显著高于HER2+或HR+肿瘤。这一发现表明,TNBC中CTSW表达的增加不仅归因于更高的TIL丰度,还反映了TNBC微环境中CD8+T细胞独特的活化状态或功能质量。
结合GSE261774的scRNA-seq数据和TCGA-BRCA的RNA-seq数据进行反卷积分析显示,具有较高水平CTSW富集的活化CD8+T细胞的患者表现出更好的预后,这与高CTSW转录水平观察到的阳性预后关联一致。接下来分析了反卷积的活化CD8+T细胞与CTSW表达之间的相关性,显示显著正相关,系数为0.55。高和低CTSW表达组之间活化CD8+T细胞丰度的进一步分析证实,高CTSW组中活化CD8+T细胞的丰度更高。
为了更深入理解CTSW表达与CD8+T细胞亚群之间的关系,研究人员在GSE261774和GSE176078数据集中对活化CD8+T细胞进行了更详细的亚型分析。在两个数据集中,将活化CD8+T细胞进一步分为三种亚型:效应记忆CD8+T细胞、效应耗竭CD8+T细胞和预备性CD8+T细胞。
通过对这三种亚型的基因表达分析,发现CTSW表达水平在记忆效应CD8+T细胞中显著高于其他两种亚型,表明记忆效应CD8+T细胞可能是CTSW的主要功能亚群。对CD8+T细胞亚群在三种乳腺癌亚型中分布的进一步分析显示,效应记忆CD8+T细胞在所有亚型中占主导地位,且在TNBC中的比例显著高于HER2+和HR+亚型。这一发现与我们之前观察到的TNBC中富集活化CD8+T细胞一致。
为了验证TNBC中CTSW表达升高是否 solely归因于效应记忆CD8+T细胞丰度的增加,研究人员特别分析了三种乳腺癌亚型中效应记忆CD8+T细胞的CTSW表达水平。结果显示,即使在相同的效应记忆CD8+T细胞亚群中,TNBC中的CTSW表达仍显著高于HER2+和HR+亚型。这一结果证实,在TNBC中观察到的CTSW表达升高不仅反映了效应记忆CD8+T细胞丰度的增加,还代表了这些细胞中CTSW的特异性上调。
通过整合GSE261774的scRNA-seq数据和TCGA-BRCA的RNA测序数据进行反卷积分析,发现具有较高水平CTSW富集的效应记忆CD8+T细胞的患者预后更好,与高CTSW表达和良好预后之间的关联一致。进一步相关性分析显示,效应记忆CD8+T细胞丰度与CTSW表达呈显著正相关,相关系数为0.73,比观察到的总体活化CD8+T细胞的相关性(r=0.55)更强。比较高CTSW表达组和低CTSW表达组,证实效应记忆CD8+T细胞的丰度在高CTSW表达组中显著更高。
值得注意的是,当在GSE176078数据集中重复相同的分析流程时,获得了高度一致的结果,进一步验证了研究结果。这些结果共同表明,CTSW主要在效应记忆CD8+T细胞中表达,并在TNBC微环境中进一步上调,可能在调节其功能和控制乳腺癌患者预后方面发挥关键作用。
3.4 研究CTSW DNA甲基化水平对乳腺癌进展的影响
为了研究CTSW DNA甲基化与乳腺癌之间的关系,研究人员使用mQTL和GWAS数据进行了SMR和TSMR分析。SMR和五个TSMR模型(包括IVW、MR-Egger等)一致显示比值比显著大于1,95%置信区间高于1,表明CTSW甲基化与乳腺癌之间存在稳健关联。与正常组织相比,癌组织中的CTSW甲基化水平更高,表明这可能是导致癌症中转录表达减少的一个潜在因素。
对TCGA-BRCA的DNA甲基化和RNA-seq数据的分析显示,CTSW DNA甲基化水平与其转录表达呈显著负相关。为了进一步研究DNA甲基化对CTSW转录的具体影响,研究人员检查了基因体和启动子区域的甲基化水平。结果表明,基因体甲基化对CTSW转录的抑制效应(R=-0.42)显著强于启动子区域甲基化(R=-0.21)。
研究结论与讨论
这项研究通过全面的多组学方法系统研究了CTSW(一个关键的半胱氨酸蛋白酶相关基因)在乳腺癌中的作用。研究结果确立CTSW作为乳腺癌进展的关键调节因子,具有深刻影响肿瘤微环境(TME)的细微表达模式。研究表明CTSW作为一个稳健的预后生物标志物,并具有作为治疗靶点的潜力,特别是在免疫活性乳腺癌亚型中。
分析揭示了CTSW复杂的双重表达模式。在组织水平上,与癌旁正常组织相比,乳腺癌中CTSW表达显著下调,这一发现通过bulk和scRNA-seq数据得到证实。这一观察结果与CTSW在其他恶性肿瘤中下调的报道一致,并得到恶性上皮细胞比正常对应细胞表现出更低CTSW表达的发现进一步支持。然而,对乳腺癌亚型的更详细分析揭示了一个显著的例外:与Luminal A/B和HER2+亚型相比,高度侵袭性的TNBC和基底样亚型中CTSW表达显著升高。这种双重表达模式——癌症中整体下调但亚型特异性上调——导致了一个关键观察结果:TNBC中高CTSW表达与显著改善的患者结局相关。
这种明显的矛盾通过考虑TNBC独特的免疫景观得到解释。TNBC肿瘤尽管具有侵袭性,但被认为是乳腺癌亚型中免疫原性最强的,通常被描述为"免疫热"肿瘤,并以高水平的肿瘤浸润淋巴细胞(TILs)为特征。临床证据表明,具有稳健免疫特征(以密集的CD8+T细胞浸润和增强的细胞毒性活性为标志)的TNBC患者经历更好的临床结局。作为主要在细胞毒性免疫细胞中表达的蛋白酶,TNBC中升高的CTSW水平可能反映了这些细胞浸润和活化的增加,将CTSW定位为有效抗肿瘤免疫反应的功能生物标志物。
为了进一步阐明CTSW预后价值的机制并验证其特异性,研究人员进行了深入的单细胞分析。这些分析证实CTSW主要在活化CD8+T细胞中表达,这些细胞的比例在TNBC中比HR+和HER2+亚型更高。此外,分析显示TNBC中CTSW表达的增加不仅归因于TIL数量的增加,还特别与TNBC内CD8+T细胞中CTSW水平的升高相关。对CD8+T细胞异质性的更深入研究显示,与效应耗竭和预备性CD8+T细胞群体相比,CTSW表达在效应记忆CD8+T细胞亚群中特别富集。这一发现完善了我们对CTSW细胞定位的理解,并表明效应记忆CD8+T细胞(对持续抗肿瘤 immunity至关重要)可能是CTSW的主要功能载体。
重要的是,当检查CD8+T细胞亚群在乳腺癌亚型中的分布时,观察到虽然效应记忆CD8+T细胞在所有亚型中占主导地位,但它们在TNBC中的比例显著升高。更揭示性的是,当特别分析效应记忆CD8+T细胞群体内的CTSW表达时,表达水平在TNBC中仍然显著高于HER2+和HR+亚型。这一双重观察——更高比例的效应记忆CD8+T细胞和这些细胞中更高的每个细胞CTSW表达——证明CTSW不仅仅是TIL丰度的替代标志物,而是TNBC微环境中细胞毒性记忆T细胞增强功能状态或优越活化状态的标志。观察到的CTSW表达与效应记忆CD8+T细胞之间更强的相关性(r=0.73)与总体活化CD8+T细胞(r=0.55)相比,进一步支持了这种关系的特异性。
这得到功能富集分析的进一步支持,该分析将CTSW与T细胞活化通路联系起来,从而加强了高CTSW表达、有效细胞毒性反应和改善患者生存之间的机制联系。反卷积分析一致证明,具有较高水平CTSW富集的效应记忆CD8+T细胞的患者经历更好的临床结局,突出了CTSW不仅作为预后标志物而且作为由记忆T细胞群体介导的功能性抗肿瘤 immunity指标的潜在临床效用。
一个从研究结果中产生的关键问题是观察到的CTSW表达与乳腺癌进展之间的关联是否是因果性的。为了解决这个问题并减轻观察性研究中固有的潜在混杂因素,研究人员采用了孟德尔随机化(MR)。SMR和TSMR分析提供了支持保护性因果关系的遗传证据,表明较高的遗传预测CTSW表达与降低的乳腺癌风险相关。这种遗传推断加强了CTSW下调不仅仅是肿瘤进展的结果,而且可能是其主动贡献者的假设。
一个显著的观察是CTSW表达与免疫检查点分子(如PD-1、CTLA-4,特别是CD96)之间的正相关。虽然这种关联可能被解释为免疫抑制的指示,但研究人员提出它反映了一个"热"但受调节的免疫环境。响应肿瘤抗原的持续T细胞活化自然诱导检查点分子的上调,作为防止过度免疫病理学的负反馈机制。因此,高CTSW和检查点标记的共表达可能识别了一个为免疫治疗准备的肿瘤生态系统。特别是,鉴于研究发现CTSW在效应记忆CD8+T细胞中富集,这些细胞以其增强的细胞毒潜力和持久性而闻名,共表达模式可能表明了一个有经验的T细胞库,可以在检查点抑制后迅速动员。具有高CTSW/高检查点特征的患者拥有一个强大的细胞毒性T细胞区室,受到抑制性信号的约束。这种准备状态表明,此类患者可能特别受益于免疫检查点抑制剂(ICIs)治疗,因为阻断可以释放预先存在的、有效的抗肿瘤反应。
最后的DNA甲基化分析为癌症细胞中CTSW下调提供了一个可能的解释。研究人员观察到CTSW启动子和基因体甲基化与其mRNA表达之间呈显著负相关,癌组织中甲基化水平更高。这表明通过DNA甲基化的表观遗传沉默是抑制CTSW在乳腺癌中保护功能的关键机制,突出了通过表观遗传调节进行治疗干预的潜在途径。理解CTSW的表观遗传调控,特别是在TNBC微环境中效应记忆CD8+T细胞功能的背景下,可能为旨在增强乳腺癌患者抗肿瘤 immunity的新治疗策略提供见解。
研究局限性
虽然这项研究提供了CTSW在乳腺癌中作用的全面多组学视角,但必须承认几个重要的局限性。最重要和最显著的局限性是缺乏对CTSW在CD8+T细胞中 proposed功能的直接实验验证。研究设计上是一个计算机模拟研究。虽然全面的计算分析——跨越转录组学、单细胞分辨率和孟德尔随机化——提供了一个强大的、多方面的证据线,但CTSW表达与调节T细胞细胞毒性、细胞因子产生和活化状态之间的明确因果联系需要通过严格的验证。因此,从研究结果中得出的机制结论应被解释为一个有充分依据但仍假设的框架,迫切需要通过未来的体外和体内实验确认。
其次,研究依赖于公开可用的回顾性数据集。虽然这允许进行强大的大规模分析,但带有固有局限性,包括样本处理的潜在异质性、不完整的临床数据以及无法控制所有潜在混杂变量。观察到的关联,虽然统计上稳健,但应在注释良好的独立患者队列中进行前瞻性验证。
最后,关于因果关系的基本问题——CTSW下调是肿瘤进展的原因还是结果——研究有特定的局限性。虽然孟德尔随机化分析为CTSW的保护性因果作用提供了强大的遗传支持,但这种统计方法有固有约束。关键的是,虽然MR旨在减轻反向因果关系,但不能完全排除复杂生物反馈环路的可能性,其中已建立的肿瘤负荷或其不断进化的微环境反过来通过遗传工具未捕获的途径影响CTSW表达。此外,MR的有效性取决于关键假设,特别是没有水平多效性,这不能用摘要级数据明确证明。因此,MR分析建议的因果联系,虽然令人信服,但必须被认为是初步的,需要通过直接功能实验进行最终验证,这些实验可以剖析这些潜在的双向关系。
结论
总之,多组学研究阐明了CTSW在乳腺癌中的双重作用。CTSW作为一个强大的预后生物标志物,高表达——特别是在TNBC中——信号表明一个有利的、免疫活性的TME和改善的患者结局。机制上,CTSW的价值超越了作为TIL丰度替代指标的作用;它是活化CD8+T细胞增强功能状态的具体指标。虽然其在癌症细胞中的表达受到表观遗传抑制,但其在TME中的作用将CTSW定位为一个有希望的患者分层生物标志物和新型免疫治疗策略的潜在靶点。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号