Φ-Space:单细胞多组学数据的连续表型分析新方法开启细胞状态精准刻画新时代
【字体:
大
中
小
】
时间:2025年10月01日
来源:Genome Biology 9.4
编辑推荐:
单细胞多组学数据的快速增长对自动化细胞注释方法提出了迫切需求。为解决现有方法在表征连续细胞状态、处理批次效应和跨组学整合方面的局限性,研究人员开发了Φ-Space计算框架。该研究采用偏最小二乘回归(PLS)建立表型空间嵌入模型,成功实现了在DC细胞发育研究、Perturb-seq遗传扰动筛选、CITE-seq多组学整合和scATAC-seq跨组学注释等多个应用场景的精准表型刻画。该方法为单细胞多组学研究提供了强大的连续表型分析工具,将显著促进发育生物学和疾病机制研究的深入探索。
随着单细胞多组学技术的快速发展,科学家们现在能够同时测量单个细胞的基因组、转录组、表观基因组和蛋白质组信息,这为深入理解细胞异质性和生物复杂性提供了前所未有的机会。然而,海量数据的快速产生也带来了巨大挑战——如何高效、准确地注释新兴数据集中的细胞群体已成为单细胞数据科学的"重大挑战"之一。
传统的细胞类型注释方法主要分为两种:基于标记基因的从头注释和基于参考数据集的自动注释。前者需要人工干预,缺乏可扩展性和可重复性;后者虽然自动化程度高,但存在明显局限性。现有方法大多将细胞类型注释视为硬分类问题,无法有效表征连续和过渡性细胞状态;除少数方法外,大多数方法只能为每个细胞分配一个标签,无法联合建模多个表型层;且难以直接利用群体水平的大量参考图谱中的丰富表型信息。
更令人头疼的是,细胞图谱通常包含来自多个实验批次和研究的数据,存在强烈而复杂的批次效应,这给现有注释方法带来了额外的计算挑战。此外,现有方法缺乏扩展到多组学数据的灵活性,导致日益常见的单细胞多组学参考数据得不到充分利用。
为了突破这些限制,Mao等人在《Genome Biology》上发表了题为"Φ-Space: continuous phenotyping of single-cell multi-omics data"的研究论文,开发了Φ-Space计算框架,采用软分类来恢复细胞状态的连续性,然后将注释结果作为下游分析的输入。
研究人员采用了偏最小二乘回归(PLS)这一线性因子建模方法,通过表型空间分析建模策略,将软分类视为向表型空间的降维,并在其中进行下游分析。具体而言,Φ-Space为每个查询细胞分配每个参考表型的连续成员资格评分,从而在多维表型空间中连续表征每个查询细胞。这种方法不需要额外的批次校正或参考和查询的协调,就能有效处理复杂的数据变异。
研究团队通过四个生物学案例研究展示了Φ-Space的多功能用途:使用批量RNA-seq参考图谱表征体外诱导的人树突状细胞(DC)的发育细胞身份;利用DICE批量图谱量化CRISPR激活(CRISPRa) Perturb-seq数据中遗传扰动对T细胞状态的影响;整合CITE-seq数据的RNA和抗体衍生标签(ADT)两种模态来表征COVID-19患者的免疫景观;以及系统评估Φ-Space在组学内和跨组学细胞类型转移中的性能。
在DC案例研究中,Φ-Space成功去除了参考图谱中的强批次效应,同时保留了足够的生物学信息来表征诱导树突状细胞的过渡状态。与需要显式协调批量参考和单细胞查询的传统方法不同,Φ-Space专注于表型空间而不是基因表达空间,有效规避了这两种数据类型之间的协调问题。
在Perturb-seq研究中,Φ-Space利用批量图谱中的精细免疫细胞状态注释,量化了大规模扰动筛选中遗传扰动对细胞状态改变的影响大小。研究发现,基于Φ-Space的激活评分比基于标记基因的评分在生物学上更具可解释性,能够更细致地分层差异激活的T细胞状态。
在CITE-seq案例中,简单的表型空间嵌入连接导致了复杂细胞表型相互作用的整合分析。与直接整合组学特征相比,表型空间方法在去除批次效应和保留疾病条件差异之间取得了更好的平衡,使研究人员能够直接比较来自不同研究的细胞类型组成和疾病条件。
在scATAC-seq研究中,Φ-Space在组学内和跨组学细胞类型转移中都表现出良好的性能,与几种最先进的方法相当。特别是,表型空间聚类优于组学空间聚类,结合了监督和无监督细胞类型识别的优势。
Φ-Space的核心创新在于其表型空间分析建模策略:将软分类视为向表型空间的降维,然后在该空间中进行下游分析。这种方法不仅能够表征连续细胞状态,处理参考和查询数据集中的批次效应,还能灵活扩展到涉及多个组学类型的注释任务。随着单细胞多组学数据变得越来越普遍,Φ-Space的这种灵活性将在生物学研究中变得越来越有用。
该研究的重要意义在于提供了一种强大的解决方案来解决单细胞多组学数据中复杂细胞状态识别的挑战。通过四个涉及批量RNA-seq、scRNA-seq、Perturb-seq、CITE-seq和scATAC-seq数据的生物学案例研究,研究人员展示了Φ-Space在连续表型分析中的灵活性和稳健性。Φ-Space发现连续表型信息的能力将促进空间表型模式的发现,有望推动发育和癌症生物学等特征为复杂和非典型细胞身份的生物学研究进展。
研究采用偏最小二乘回归(PLS)建立表型空间嵌入模型,使用来自多个公开数据库的样本数据:包括341个批量RNA-seq样本的DC图谱、28,453个人原代T细胞的Perturb-seq数据、162,232个PBMC细胞的CITE-seq数据(来自130名COVID-19患者和22名自身免疫疾病患者),以及69,249个BMMC细胞的10x多组学数据。通过交叉验证程序评估方法性能,采用平衡分类错误率和多种聚类指标进行量化分析。
通过树突状细胞案例研究,Φ-Space展示了其表征参考中未定义的诱导树突状细胞发育细胞状态的能力。研究发现,Φ-Space选择了生物学上有意义的基因来保留批量数据集中的表型变异。为了并排可视化批量样本和单个细胞,Φ-Space使用参考和查询的表型空间嵌入而不是基因表达进行参考映射。这种方法不需要这两种数据类型的显式协调,例如插补。此外,Φ-Space成功建模了两个不同的细胞表型层——细胞类型和样本来源,与独立建模相比产生了更好的结果。
在Perturb-seq研究中,Φ-Space能够捕捉细微的T细胞状态。研究人员发现,基于Φ-Space的激活评分比基于标记基因的评分在生物学上更具可解释性。丰富的细胞状态信息还使得能够量化扰动对除激活之外的T细胞状态的影响。例如,研究发现增强TBX21和GATA3基因分别显著促进T辅助1(Th1)和T辅助2(Th2)细胞状态,这两个基因在Th1和Th2分化中已知起关键作用。
在CITE-seq案例研究中,简单的表型空间嵌入连接导致了复杂细胞表型相互作用的整合分析。研究发现,表型空间嵌入在去除批次效应和保留疾病条件差异之间取得了更好的平衡。Φ-Space多组学整合方法还提供了量化细胞类型和疾病条件之间复杂相互作用的新方法。与传统方法相比,这种方法能够直接比较不同研究中的细胞类型组成。
在scATAC-seq案例研究中,Φ-Space在组学内和跨组学细胞类型转移中都表现出良好的性能,与几种最先进的方法相当。研究发现,表型空间聚类优于组学空间聚类,结合了监督和无监督细胞类型识别的优势。完全监督细胞类型转移的一个限制是,查询中存在的细胞类型不一定在参考中定义(例如,健康参考中不存在的癌细胞)。为了解决这个问题,Φ-Space可以使用无监督聚类来识别均匀的细胞簇,然后基于其标记基因识别每个细胞簇的细胞类型。
该研究开发的Φ-Space框架成功解决了当前最先进自动注释方法面临的众多挑战,包括识别连续细胞状态、处理参考中的批次效应、利用批量参考以及包含多组学参考和查询。通过四个生物学案例研究(DC、Perturb-seq、CITE-seq和scATAC-seq),研究人员展示了Φ-Space在连续表型分析中的多功能用途。
Φ-Space方法的核心创新在于其表型空间分析——使用软分类作为降维的建模策略。这种建模策略在计算生物学中大大未充分利用。该研究证明,这种建模策略产生了非常灵活的工具,用于建模多组学数据中的复杂表型变异。虽然Φ-Space使用了一种特定的软分类方法PLS,但任何软分类方法都可用于Φ-Space类型的分析。这进一步证明了Φ-Space的价值,不仅作为连续建模细胞表型的多功能计算工具包,而且作为通用建模策略。
Φ-Space在揭示不同细胞表型的复杂相互作用方面具有巨大潜力。随着单细胞多组学数据变得越来越普遍,跨组学和多组学注释在生物学研究中将越来越有用。特别是,研究人员的研究方法不能通过替代方法如SingleR、Seurat V3或Seurat V4复制,因为他们使用桥接数据集注释查询,然后训练PLS回归模型来预测连续表型矩阵——后者无法通过这些替代软分类方法实现。
该研究的局限性在于当前工作没有利用批量多组学参考图谱。一个潜在的扩展是整合批量和单细胞多组学数据。基于一些初步结果,研究人员发现将Φ-Space应用于基于scRNA-seq参考解析实体组织(如乳腺肿瘤)批量样本中的细胞类型是有前途的。另一个可能的扩展是将Φ-Space发展为注释由完全不同平台生成的空间转录组数据的统一方法。
总之,Φ-Space代表了一个强大的解决方案,用于解决单细胞多组学数据中复杂细胞状态识别的挑战。通过四个涉及批量RNA-seq、scRNA-seq、Perturb-seq、CITE-seq和scATAC-seq数据的生物学案例研究,研究人员展示了Φ-Space在连续表型分析中的灵活性和稳健性。Φ-Space发现连续表型信息的能力将促进空间表型模式的发现,有望 empower 发育和癌症生物学等特征为复杂和非典型细胞身份的生物学研究。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号