
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:干细胞谱系承诺中的三维基因组结构:从结构组织到精准调控
【字体: 大 中 小 】 时间:2025年09月18日 来源:Advanced Genetics
编辑推荐:
本综述系统阐述了干细胞命运决定中三维基因组结构与表观遗传调控的精密互作机制,重点介绍了染色质区室(A/B compartments)、拓扑关联域(TADs)和染色质环(chromatin loops)的动态重组规律,以及液-液相分离(LLPS)介导的转录凝聚体(如超增强子)在基因表达调控中的核心作用。文章深入探讨了多组学整合与人工智能预测模型在解析染色质空间折叠与细胞命运关联中的前沿应用,为再生医学和精准疾病治疗提供了新视角。
干细胞谱系承诺受表观遗传机制与三维基因组结构的复杂互作调控。传统线性表观遗传学(如DNA甲基化和组蛋白修饰)难以完全解释基因表达的复杂时空协调性。空间基因组学技术(如高通量染色体构象捕获技术Hi-C、单细胞Hi-C和染色质免疫沉淀联合Hi-C技术Hi-ChIP)的革命性进展,为解析基因组结构提供了新视角,揭示了染色质区室、拓扑关联域(TADs)和染色质环等关键结构单元。这些结构在分化过程中动态重组,影响转录可及性和谱系特异性基因激活。此外,液-液相分离(LLPS)介导的转录凝聚体(如转录工厂和超增强子)已成为细胞命运转变过程中基因表达模式的关键调控者。多组学数据与人工智能驱动的预测模型相结合,进一步深化了对这些调控网络的理解。尽管存在分辨率限制、数据复杂性和因果推断等技术挑战,基于CRISPR的空间基因组编辑和AI计算平台等工程化干预策略,有望将结构洞察转化为再生医学中的靶向治疗策略。
干细胞谱系承诺指干细胞逐渐丧失多向分化潜能、最终确定谱系分化的过程。其本质在于特定时空条件下通过表观遗传调控对基因表达进行精确编程。传统表观遗传学主要关注线性机制(如DNA甲基化和组蛋白修饰),通过改变染色质结构可逆地开启或关闭基因。然而,一维线性表观遗传学难以解释谱系分化过程中基因表达的时空协调性。例如,神经嵴干细胞分化需要远端增强子与启动子的空间互作,而线性表观信号无法完全解析此类远程调控网络。此外,造血干细胞中的基因突变通过三维基因组重构驱动白血病发生,这难以解释由染色质空间折叠介导的98%非编码区的调控作用。这种认识凸显了单维表观遗传分析的内在局限性,亟需转向空间分辨的基因组研究范式。
空间基因组学将视角从线性表观遗传转向将基因组视为动态折叠的空间网络。其基本架构包含三个关键结构:染色质区室、拓扑关联域(TADs)和染色质环。染色质区室指染色质划分为具有不同功能特性的核内区域,主要分为A和B区室。A区室通常转录活性较高,被视为开放染色质区域;而B区室显示较低转录活性,与基因沉默和异染色质形成相关。TADs是染色质的结构单元,其边界由CTCF蛋白和非编码RNA等调控元件维持。在TAD内部,染色质片段紧密互作,形成独立的结构单元。染色质环是互作频率较高的区域,在TAD内进一步细分,包括远程染色体互作(如启动子与远端增强子之间的环)和短程染色体互作。
空间基因组学的兴起得益于技术突破,使表观遗传研究从平面转向三维。Hi-C(高通量/高分辨率染色质构象捕获)、Hi-ChIP(原位Hi-C结合染色质免疫沉淀)和单细胞Hi-C等技术的进展,揭示了基因组的动态折叠模式。例如,利用果蝇亚kb分辨率原位Hi-C,研究者识别出近8倍于先前报道的TAD数量。scNanoHi-C技术的发展支持有效分析三维染色质结构并区分单个细胞间的结构亚型,为在单细胞水平研究高阶三维基因组组织提供了新机遇。
通过整合Hi-C、ATAC-seq和RNA-seq,发现多发性骨髓瘤中的拷贝数变异(CNVs)使TAD数量增加25%,且断点显著重叠于TAD边界,表明基因组变异与三维结构互作驱动癌症进展。通过结合单细胞三维基因组(scHi-C)、表观遗传修饰(ATAC-seq、ChIP-seq)和蛋白质互作(AP-MS)数据,研究者可构建干细胞分化的“数字孪生”模型,模拟染色质区室重组、转录凝聚体形成,并预测干预措施对分化通路的影响。这些通路包括谱系承诺通路、分化阻滞通路和分化漂移校正通路。同时,RNA表观遗传增添了新调控层:poly(A)尾动态和m6A修饰通过调控mRNA核质运输和空间定位编码表观遗传信息, refine干细胞命运决定的时空精确性,为以RNA为中心的三维基因组编辑工具奠定基础。近期研究提出,三维基因组不仅存在静态结构分区,还承载动态转录凝聚体。这些相分离枢纽浓缩转录机器和调控元件,在干细胞命运决定中(尤其在外部刺激或分化信号下)提供新的控制层。
近期,空间基因组学与人工智能(AI)结合为疾病机制研究开辟了新维度。AI驱动的三维结构预测为解读染色质折叠动力学提供了新工具。基于深度学习的模型模拟干细胞分化或癌变过程中的染色质环形成和TAD边界重构,将靶点发现效率提高3-5倍。展望未来,AI驱动的跨尺度、多模态平台将推动三维基因组学从结构解析走向动态干预,开拓再生医学新前沿。
因此,空间基因组学为理解干细胞分化过程中基因组结构如何支配功能提供了全面、多维的方法。未来与人工智能和可编程基因组编辑工具的整合,有望重新定义发育生物学和再生医学的前沿。
干细胞多能性的维持依赖于特定的三维基因组结构基序,包括染色体疆域(CT)、染色质区室、拓扑关联域(TADs)和染色质环。这些静态结构共同建立了独特的核环境,从而实现多能状态。
染色体疆域指每条染色体在细胞核中占据的特定区域。这些区域在细胞周期不同阶段呈现不同形态和功能。染色体疆域在细胞核内呈现高度有序的层级结构,能够维持基因组的稳定性和秩序。它们占据核内特定空间位置,并与其他染色体疆域存在特定互作和交流。
通过Hi-C技术发现,整个基因组被划分为A/B区室。A区室转录活跃,富含开放染色质、基因密度高且GC含量高,通常位于核内部,与持续转录和更开放的染色质构象相关。B区室是转录沉默区域,与关闭染色质、基因稀少和压缩相关,通常位于核周边,以更凝聚的染色质状态为特征。值得注意的是,与分化细胞相比,造血干细胞中活性与非活性区室之间的分区较不明确,允许更大的转录可塑性。这种可塑性对多能干细胞的自我更新和分化潜能至关重要。
拓扑关联域(TADs)是三维基因组组织的基本结构单元。在TAD内部,染色质片段之间的互作频率高于与其他TAD区域染色质片段的互作。这种高阶染色质组织使得同一TAD内的基因能够被共享调控元件(如增强子和沉默子)协同调控。因此,不同TAD之间的基因表达相对独立。这种基因组分区成TADs确保了关键多能性基因(如OCT4、SOX2和NANOG)的精确调控。这些基因对维持多能状态至关重要,其 improper 调控会导致多能性丧失和细胞分化。TAD边界通常由特定DNA序列 motif 界定,并由架构蛋白(如CTCF和粘连蛋白)维持。TADs的完整性对基因组的正常功能至关重要,任何TAD结构的改变都可能对基因调控和细胞功能产生深远影响。
染色质环由三维空间中远端染色质区域之间的互作形成。CTCF是一种在染色质环边界富集的转录因子,它可与环状蛋白复合物粘连蛋白互作,促进染色质环结构的形成和维持。染色质环使调控元件(如增强子和启动子)在三维空间中紧密接近,从而实现调控元件与靶基因之间的高效通讯,允许基因表达的精确调控。在多能干细胞中,这种三维基因组组织使其能够快速响应外部信号并启动分化程序。染色质环的动态特性允许基因调控网络响应发育线索和信号通路快速重新配置。例如,在分化过程中,新染色质环的形成可将谱系特异性调控元件与靶基因接触,激活其表达并驱动细胞特化。CTCF/粘连蛋白介导的染色质环挤压模型被提出来解释染色质环的形成及其在基因调控中的作用。该模型表明,粘连蛋白复合物环绕染色质纤维并沿其移动,挤出环直至遇到CTCF结合的边界。这一过程有助于建立复杂的染色质环网络,构成多能干细胞和发育过程中复杂基因调控景观的基础。
区室转换涉及特定染色质区域从与常染色质的空间互作转变为与异染色质互作,或反之。常染色质与主动转录相关,而异染色质与转录抑制相关。这种动态过程可改变转录可及性并影响基因表达。在细胞分化过程中,某些区域可能从活性A区室转换为转录沉默的B区室,或反之。例如,在小鼠胚胎干细胞分化为神经祖细胞的研究中,与神经元功能相关的基因位点(如Syn1)从B区室转换到A区室,伴随染色质可及性增加和转录激活;相反,一些多能性相关基因(如Nanog)经历相反转换(从A到B),伴随其沉默。此类区室转换可由染色质状态变化驱动,如DNA甲基化、组蛋白修饰和染色质可及性。这些变化可由多种因素引起,包括染色质重塑复合物的招募和转录因子的作用。基因在区室之间的重新定位可影响其转录活性,从而影响细胞分化。
在细胞分化和发育过程中,新的TAD边界出现,从而改变基因组景观和基因调控网络。新TAD边界的出现有助于隔离特定谱系的调控程序,确保TAD内的协调基因表达,并使其免受邻近区域调控因子的影响。例如,在小鼠神经发育过程中,Sox9-Kcnj2基因位点区域形成新的TAD边界。该边界将Sox9(神经嵴发育的关键基因)的神经特异性增强子与相邻的Kcnj2基因(在心脏中高表达的钾离子通道基因)隔离。这种新的TAD结构确保Sox9增强子仅激活其自身启动子,而不干扰Kcnj2,从而精确协调神经谱系分化程序,同时抑制不相关基因的异位激活。TAD边界的建立和维持依赖于多种因素,包括CTCF结合位点、粘连蛋白复合物和染色质修饰。TAD边界或其调控元件的破坏可能导致异常基因表达,并与多种疾病相关。这种空间重连对建立谱系保真度至关重要。
新形成的染色质环可将线性基因组序列中遥远但需要互作以进行精确基因表达调控的谱系特异性增强子和启动子聚集在一起。在造血谱系中,新环的形成连接了关键基因(如GATA1和RUNX1)的启动子与其远端谱系特异性增强子。GATA1是红系和巨核细胞发育必不可少的转录因子,而RUNX1在造血干细胞发育和分化中起关键作用。这些特异性增强子-启动子环的建立确保了谱系决定基因的适时适当表达,驱动造血干细胞分化为各种血细胞类型。这一过程涉及多种染色质相关蛋白的协调作用,如转录因子和架构蛋白(如CTCF和粘连蛋白)。染色质环的动态调控对于正确执行谱系特异性基因表达程序和细胞分化至关重要。
三维基因组结构与表观遗传修饰复杂关联,并参与双向交叉对话以调控干细胞命运。一方面,基因组的空间组织影响染色质对表观遗传调控因子的可及性。例如,基因在A/B区室和TAD中的定位决定了其暴露于组蛋白修饰酶和DNA甲基转移酶的可能性。A区室中的基因更可能获得激活型组蛋白修饰,而位于B区室的基因通常被抑制性修饰标记。另一方面,表观遗传修饰也可影响三维基因组结构。DNA甲基化模式和组蛋白翻译后修饰可改变染色质对架构蛋白(如CTCF和粘连蛋白)的亲和力,从而影响TAD和染色质环的形成和稳定性。三维基因组结构和表观遗传共同控制干细胞分化过程,确保其成功完成。
转录工厂是由RNA聚合酶II和转录因子在核内富集形成的局部中心。液-液相分离(LLPS)在其形成中起重要作用。该机制导致广泛分布于核内的RNA聚合酶II聚集形成转录工厂。在此过程中,RNA聚合酶II与其他转录因子、辅因子和DNA结合蛋白互作,形成高度有序且动态的凝聚体。这些凝聚体通过多价互作(如转录因子的多结构域互作、DNA的多结合位点协作,以及关键地,这些组分内在无序区(IDRs)内特定氨基酸序列“语法”介导的多价、低亲和力互作)提供大量弱协同互作位点,从而实现相关分子的高效聚集。这种相分离过程提高了转录因子和RNA聚合酶II的局部浓度,同时增强了它们的功能互作,为转录过程的高效起始和延续创造了有利条件。转录工厂内的转录过程高度活跃,多个基因可同时转录,极大增强了基因表达效率。每个转录工厂通常包含多个活性基因,这些基因以环状或折叠形式与RNA聚合酶II和其他转录因子紧密接近,创造了高度有序的转录环境。此外,转录工厂是动态的,能够根据细胞需求快速调整其组成和位置。在细胞应激或分化过程中,转录工厂可快速改变其包含的基因和转录因子组合以适应新的转录任务。这种动态调整能力使其能够灵活响应胞内外环境变化,并确保基因表达的精确调控。例如,在果蝇胚胎发育中,转录工厂的组成和位置在不同阶段发生变化,影响基因表达的精确性。在胚胎发育早期,转录工厂富含母源转录因子,这些因子精确调控早期基因表达。随着胚胎发育,合子基因逐渐激活,转录工厂中合子转录因子的比例增加,确保合子基因的准确表达。
超增强子凝聚体是由液-液相分离(LLPS)介导的增强子聚集形成的结构。超增强子是基因组中强烈激活基因表达的DNA序列段,通常与细胞身份基因相关。这些凝聚体的形成允许多个增强子聚集并增强其与关联启动子的活性,从而提升细胞身份基因的表达水平。超增强子凝聚体的形成依赖于多种转录因子和辅因子的协同作用,这些因子通常包含广泛的内在无序区(IDRs)。这些IDRs以特定氨基酸组成和 motif 为特征(其“语法”),有利于弱多价互作,是LLPS的关键驱动因素, enabling 动态凝聚体的组装。例如,某些转录因子(如Mediator复合物和溴结构域蛋白(如BRD4,其大IDRs富含酪氨酸和其他有利于相分离的残基)在凝聚体形成中起关键作用。这些因子通过结合增强子上的特定序列并与其他转录因子互作,形成高度有序的网络结构。该结构不仅提高了增强子与启动子互作的效率,还促进了RNA聚合酶II的招募和转录起始复合物的组装。超增强子凝聚体在细胞分化和发育中起关键作用。在小鼠胚胎干细胞分化为神经细胞的过程中,驱动Neurod1表达的超增强子包含多个紧密排列的增强子元件(如hs158、hs230等)。这些元件通过相分离介导的凝聚体形成聚集,极大增强了它们对Neurod1启动子的协同激活。Sox9的超增强子也表现出类似特性和动态重组。
转录凝聚体(包括转录工厂和超增强子凝聚体)的动态形成或解离在塑造细胞分化过程中的基因表达景观中起关键作用。这些凝聚体的形成和解离高度动态,使其能够根据细胞分化需求快速调整基因表达模式。研究表明,凝聚体动力学与细胞内信号通路激活密切相关。在分化信号刺激下,特定转录因子和辅因子(许多携带具有相分离倾向的氨基酸“语法”的IDRs)通过相分离机制快速聚集形成凝聚体,并激活特定基因表达。当细胞分化到下一阶段时,凝聚体再次解离,释放分子使其可重新分布到其他区域参与新基因表达的调控。这种可逆性 fundamentally 与IDRs的生物物理性质相关:其固有的灵活性和可调的多价互作强度(由氨基酸序列和翻译后修饰决定)允许凝聚体响应细胞信号快速组装和解组装。例如,在造血干细胞向红系分化的早期阶段,GATA1超增强子簇的形成促进GATA1自身及其下游红系基因的表达,从而启动红系分化程序。随着分化推进,这些凝聚体逐渐解聚,为后续阶段的基因表达调控让路。这种动态变化不仅确保了分化过程中基因表达的精确协调,还为细胞适应环境变化提供了灵活性。此外,凝聚体的动态调控涉及多种表观遗传修饰和染色质重塑过程。例如,组蛋白修饰酶和染色质重塑复合物可通过改变染色质状态影响凝聚体形成和稳定性。这种多层级调控机制使得复杂分化过程中的基因表达得以精细调控,并确保细胞按预定程序分化和发育。
三维基因组结构分析因当前技术产生的庞大数据集而面临前所未有的计算挑战。Hi-C及相关染色体构象捕获方法常规产生数十亿测序读长,必须经过多重处理步骤,包括比对、过滤、标准化。每个计算步骤都可能引入潜在偏差和人为误差,显著影响下游分析,要求研究者在数据处理的每个阶段实施严格的质量控制措施。处理这些数据集所需的大量计算资源(包括具有大内存容量的高性能计算集群)成为三维基因组研究的重要瓶颈。当研究干细胞分化等动态过程(需要多个时间点或生物学重复)时,这种资源限制变得尤为突出。
多组学数据与三维基因组信息的整合带来了当前计算方法仍在努力有效解决的分析复杂性新层。将Hi-C数据与补充数据集(如染色质可及性(ATAC-seq)、组蛋白修饰模式)结合需要 specialized 算法和统计方法来识别有生物学意义的模式和关系。许多现有生物信息学工具为分析单一数据类型开发,缺乏适当整合跨多组学层信息(尤其在研究干细胞谱系承诺等关键发育转变中的动态变化时)所需的复杂性。该领域目前缺乏数据处理和整合的标准化方案和基准,使得不同实验室研究之间的比较困难,并可能限制研究结果的可重复性。
单细胞三维基因组技术的近期进展 dramatically 增加了数据分析流程的复杂性,同时提供了干细胞群体中细胞异质性的前所未有的分辨率。单细胞Hi-C方法虽然强大于揭示染色质架构中的细胞间变异,但与传统批量方法相比,产生的数据极其稀疏和嘈杂。需要 specialized 统计方法和机器学习方法来区分技术 artifacts 与真正的生物学变异,尤其在研究稀有干细胞亚群或分化过程中的瞬时中间状态时。当尝试将单细胞染色质构象数据与其他单细胞模态(如转录组学或表观遗传学)关联时,计算挑战 further 加剧。尽管存在这些困难,开发更用户友好的分析平台和可视化工具仍然是迫切需求,以使这些强大但复杂的技术对没有 specialized 计算专业知识的生物学家可及。当前创建标准化工作流程和基准数据集的努力应有助于解决部分挑战,但充分实现单细胞三维基因组分析在干细胞研究中的潜力仍需大量工作。
重复DNA元件因当前测序和 mapping 技术的基本限制而 presents 独特且持续的分析挑战。这些重复序列构成近半数人类基因组,因大多数高通量测序读长无法明确映射到特定基因组位置而 notoriously 难以分析。因此,许多染色质互作研究要么完全排除重复区域,要么以降低置信度分析, potentially 错过可能对干细胞生物学特别重要的调控互作。鉴于重复元件 frequently 富集于调控多能性和分化的调控区域,且许多在进化过程中被征用为功能元件,这一分析缺口尤其令人担忧。无法正确分析这些区域在我们理解三维基因组组织如何贡献于干细胞功能和谱系承诺方面留下显著空白。
着丝粒周围和端粒区域包含高度重复序列,对当前三维基因组技术 presents 特别棘手的挑战。这些区域形成核的重要结构元件,并在干细胞分化和细胞重编程等关键发育转变中经历动态重组。然而,由于读长 mapping 算法的基本限制和重复元件的固有序列相似性,当前Hi-C方案难以解析这些区域内的互作。由此产生的分析盲点尤其 problematic,因为这些区域已知在核架构和染色体定位中起重要作用,这可能对维持干细胞身份或促进分化至关重要。长读长测序等新兴技术可能最终帮助解决部分挑战,但在重复区域能够以与独特基因组序列相同的置信度分析之前,仍需 significant 方法学改进。
转座元件因其丰度、序列相似性和发育过程中的动态调控而 presents 另一层三维基因组分析复杂性。许多转座元件在进化过程中被征用为调控元件,控制胚胎发生和干细胞分化过程中的基因表达程序。然而,标准比对工具和分析流程经常错误分配源自转座元件的读长或将其作为不可比对丢弃, potentially 掩盖由这些序列介导的重要染色质互作。分析挑战因不同转座元件类别(LINEs、SINEs、LTRs等)各 presents 独特的 mapping 困难并可能需要 specialized 分析方法而加剧。需要新的计算方法 specifically 解决重复富集区域, potentially 结合长读长测序与 specialized 比对算法,以 fully 表征三维基因组景观及其在干细胞生物学中的作用。在这些技术挑战克服之前,我们对重复元件如何贡献于干细胞染色质架构和基因调控的理解将仍不完整。
当前三维基因组技术面临分辨率的根本限制,阻碍了在完全理解基因调控所需尺度上精确 mapping 染色质互作。即使需要巨大测序深度的高分辨率Hi-C数据集,在最优条件下通常 achieve 不优于1–5 kb的分辨率。当研究小但关键的基因组区域(如增强子-启动子互作或干细胞中的边界元件)时,这一分辨率差距尤其 problematic。虽然互作边界的精确 mapping 可提供对基因调控机制的关键洞察,但当前技术难以实现。当研究大基因组或复杂基因座(需要更高分辨率以区分多个潜在互作伙伴)时,情况变得更具挑战性。虽然Micro-C和超分辨率显微镜等新兴技术承诺改进分辨率,但它们自身在通量、成本和技术复杂性方面存在限制, currently 限制其在干细胞研究中的广泛采用。
染色质互作检测的灵敏度仍然是另一个主要挑战,限制了我们研究稀有但生物学重要互作的能力。许多功能显著的染色质互作以相对低频发生,当前方法难以在背景噪声水平上检测。当研究稀有细胞群体时,这种灵敏度限制变得尤为明显,其中可用于分析的有限细胞数量 further 降低了检测较弱互作的能力。分子生物学创新与改进的噪声 reduction 计算方法相结合的更灵敏检测方法的开发,可能揭示先前隐藏的三维基因组调控方面。单分子成像和测序技术的近期进展 may 提供克服这些灵敏度限制的途径。
研究三维基因组动力学的活细胞成像方法面临其自身的分辨率和灵敏度约束集,限制其在干细胞研究中的效用。虽然提供关于染色质组织在分化或重编程等过程中如何变化的关键 temporal 信息,但这些方法通常提供比测序 based 方法更低的空间分辨率。光漂白和光毒性效应 further 限制活细胞实验的持续时间和灵敏度,使得在延长时间段研究 delicate 干细胞群体 particularly 具有挑战性。超分辨率显微镜与测序方法的整合可能最终帮助桥接这些技术差距,但当前实现 suffer 于同时研究多个基因组基因座的限制。对于研究干细胞分化等动态过程(高空间分辨率和 temporal 信息都 crucial),该领域仍缺乏能够以必要尺度和分辨率提供全面三维基因组信息的稳健方法。克服这些限制将需要实验技术和计算分析方法的创新,以 fully 捕获细胞命运决定过程中染色质架构的动态性质。
研究染色质动力学在干细胞命运决定中作用的一个核心挑战是建立观察到的染色质变化与特定谱系承诺之间的 definitive 因果关系。虽然许多研究将染色质可及性、组蛋白修饰和三维基因组组织的改变与分化结果相关联,证明这些变化直接驱动细胞命运决定仍然难以捉摸。例如,与谱系特异性基因相关的增强子处染色质的开放通常先于转录激活,暗示调控作用。然而,尚不清楚这些可及性变化是 causative 还是 merely permissive 用于基因表达。CRISPR介导的增强子或架构蛋白扰动可帮助揭示因果关系,但其解释因多效效应和补偿机制而复杂化,这些机制可能掩盖真实功能。
染色质的动态性质 further 使因果关系评估复杂化,因为许多修饰和结构重排在分化过程中快速且瞬时发生。例如,在造血干细胞(HSC)分化过程中,广泛的染色质重塑先于谱系承诺,但区分这些全局变化中的驱动因素与乘客具有挑战性。单细胞多组学方法揭示了即使在表型同质的干细胞群体中染色质状态的 substantial 异质性,表明染色质与命运之间的确定性关系可能仅在群体水平出现。此外,分化轨迹的非线性和 often 随机性质使得难以 pinpoint 哪些染色质变化对特定结果 essential versus 那些是另一个调控事件的次要后果。
跟踪相同细胞随时间变化的染色质和转录变化的纵向研究对于解析因果关系至关重要,但仍然技术 demanding。虽然活细胞成像和顺序单细胞测序方法提供有希望的途径,但它们 currently 缺乏在快速命运转变期间全面 mapping 染色质动力学所需的分辨率和通量。计算建模方法(如布尔网络或动态系统理论)可帮助从染色质和基因表达数据的静态快照推断因果关系,但这些模型需要通过 targeted 扰动进行验证。最终,建立染色质动力学与细胞命运之间的机制联系将需要整合遗传扰动、时间分辨成像和计算预测,以超越相关性。
表观遗传记忆——从细胞发育历史继承的染色质状态的持久性——为因果困境引入了另一层复杂性。干细胞 often 保留来自先前分化事件的表观遗传标记,这可能偏倚其对后续命运决定信号的响应。例如,造血干细胞显示谱系启动,其中亚群在承诺前表现出与特定谱系 linked 的染色质可及性,表明表观遗传记忆偏倚分化路径。类似地,诱导多能干细胞(iPSCs) frequently 保留来自其体细胞起源的残留DNA甲基化签名,这可能影响其分化潜能并创建iPSC系之间的功能差异。ATAC-seq数据的足迹分析可 further 剖析表观遗传记忆的调控逻辑——该方法识别特定染色质状态内的转录因子(TF)结合位
生物通微信公众号
知名企业招聘