
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CAECC-Subtyper:一种新颖的卷积自编码器框架,用于整合癌症亚型分析中的多组学数据
《Biochemical Genetics》:CAECC-Subtyper: A Novel Convolutional Autoencoder Framework for Integrating Multi-omics Data in Cancer Subtyping
【字体: 大 中 小 】 时间:2025年12月05日 来源:Biochemical Genetics 1.6
编辑推荐:
癌症亚型分型研究提出CAECC-Subtyper框架,整合mRNA、miRNA、lncRNA、甲基化及蛋白质多组学数据,采用卷积自编码器特征提取与共识聚类算法实现患者分型,生存分析显示亚型间预后差异显著(p<0.01),外部数据集验证其泛化性,并发现特异性生物标志物。
癌症是一组复杂的疾病,其特征是存在多种分子层面的改变,包括基因组、表观遗传和转录组的变化,这些变化在不同类型的癌症中各不相同。这种异质性使得标准化治疗的开发变得复杂,因此准确识别癌症亚型对于实现靶向治疗和改善患者预后至关重要。在这项研究中,我们提出了CAECC-Subtyper这一新型癌症亚型分类框架,该框架整合了多组学数据对癌症患者进行分类。所提出的方法结合了卷积自编码器和共识聚类模块:卷积自编码器用于从多组学数据集中提取相关特征,随后这些特征被用于共识聚类,将患者分为不同的亚型。我们使用了来自癌症基因组图谱(The Cancer Genome Atlas)的乳腺癌患者的多组学数据,包括mRNA、miRNA、lncRNA、甲基化以及蛋白质谱型。通过CAECC-Subtyper框架识别的群体在使用对数秩检验(log-rank test)进行生存差异评估后,发现了具有统计学显著性的差异。我们将该方法与文献中的现有技术进行了性能比较,证明了其优越性或竞争力。此外,还在三个外部数据集上评估了该方法的泛化能力和预后意义,证实了其在外部乳腺癌队列中的高度显著预后价值。通过差异基因表达分析和最小冗余最大相关性算法(Minimum Redundancy Maximum Relevance algorithm)发现了特定于这些乳腺癌亚型的生物标志物,其临床相关性得到了现有文献的支持。

癌症是一组复杂的疾病,其特征是存在多种分子层面的改变,包括基因组、表观遗传和转录组的变化,这些变化在不同类型的癌症中各不相同。这种异质性使得标准化治疗的开发变得复杂,因此准确识别癌症亚型对于实现靶向治疗和改善患者预后至关重要。在这项研究中,我们提出了CAECC-Subtyper这一新型癌症亚型分类框架,该框架整合了多组学数据对癌症患者进行分类。所提出的方法结合了卷积自编码器和共识聚类模块:卷积自编码器用于从多组学数据集中提取相关特征,随后这些特征被用于共识聚类,将患者分为不同的亚型。我们使用了来自癌症基因组图谱(The Cancer Genome Atlas)的乳腺癌患者的多组学数据,包括mRNA、miRNA、lncRNA、甲基化以及蛋白质谱型。通过CAECC-Subtyper框架识别的群体在使用对数秩检验(log-rank test)进行生存差异评估后,发现了具有统计学显著性的差异。我们将该方法与文献中的现有技术进行了性能比较,证明了其优越性或竞争力。此外,还在三个外部数据集上评估了该方法的泛化能力和预后意义,证实了其在外部乳腺癌队列中的高度显著预后价值。通过差异基因表达分析和最小冗余最大相关性算法(Minimum Redundancy Maximum Relevance algorithm)发现了特定于这些乳腺癌亚型的生物标志物,其临床相关性得到了现有文献的支持。

生物通微信公众号
知名企业招聘