综述:可移动元件在健康与疾病中的作用:分子基础及临床意义
《Cardiovascular Endocrinology & Metabolism》:Transposable elements in health and disease: Molecular basis and clinical implications
【字体:
大
中
小
】
时间:2025年09月29日
来源:Cardiovascular Endocrinology & Metabolism 1.1
编辑推荐:
转座子(TEs)作为基因组动态元件,参与调控基因表达、染色体结构和免疫反应,其激活与抑制失衡与癌症、神经退行性疾病及衰老相关。TEs通过DNA甲基化、组蛋白修饰、RNA干扰等多层次机制受控,并在疾病中产生新抗原,成为免疫治疗靶点。研究其作用机制及开发靶向疗法对精准医学具有重要意义。
转座子(TEs)曾经被视为基因组中的“垃圾DNA”,如今被重新认识为调控基因组功能和人类疾病的关键因子。这些可移动的遗传元件包括逆转录转座子(如长散在核元件[LINE-1]、Alu、SINE-可变串联重复[Alu] [SVA]以及人类内源性逆转录病毒[HERV])和DNA转座子。它们的活动受到多层机制的严格调控,这些机制从转录到基因组整合的各个阶段均发挥作用。尽管在体细胞中通常被沉默,但在关键发育阶段,如合子基因组激活(ZGA)和细胞命运决定过程中,它们会被短暂激活,从而影响染色质结构、转录网络、RNA加工以及先天免疫反应。然而,转座子的异常激活可能导致基因组不稳定性、慢性炎症以及多种病理状态,包括癌症、神经退行性疾病和衰老。令人惊讶的是,它们的重新激活也带来了新的临床应用前景,尤其是在诊断标志物和治疗靶点方面。理解转座子的双重作用,并在正常发育和疾病之间取得平衡,对于推进新型疗法和精准医学至关重要。
转座子的结构和功能多样性使得它们在所有生命形式中普遍存在。它们通过不同的机制在基因组中移动,推动遗传多样性和基因组进化。在人类基因组中,转座子占了约50%,远超蛋白质编码基因所占的1.5%。根据其转座机制,转座子可分为两大类:一类是逆转录转座子(Class I),另一类是DNA转座子(Class II)。逆转录转座子通过“复制粘贴”机制进行移动,需要RNA作为中间产物,然后通过逆转录酶将其转化为DNA。而DNA转座子则采用“剪切粘贴”机制,无需RNA中间体。逆转录转座子又可细分为长末端重复(LTR)和非LTR逆转录转座子,后者包括LINE和SINE。这些转座子在人类基因组中具有重要的进化意义,尽管大多数已经失活,但它们仍然可能影响基因表达和基因组结构。
在DNA转座子中,典型的结构包括编码DNA转座酶的基因序列,以及两个倒置的末端重复(ITR)序列。转座酶能够结合并切割ITR序列,从而将转座子从原位移除,并重新整合到新的基因组位置。尽管DNA转座子在人类基因组中相对较少,且大多数已失活,但它们在基因组进化过程中曾发挥重要作用,例如促进了关键基因如RAG1和RAG2的出现,这些基因参与V(D)J重排,并产生了功能性的宿主-转座子融合蛋白,成为表观遗传调控的重要组成部分。
LINE-1(L1)是人类中唯一活跃的自主转座子,它编码了自身移动所需的所有成分。RNA聚合酶II(Pol II)转录完整的L1 RNA,然后将其翻译为两种关键蛋白:开放阅读框(ORF)1(一种RNA结合蛋白)和ORF2(一种双功能酶,具有AT富集DNA的内切酶活性和逆转录酶活性)。逆转录过程通过靶向引物逆转录(TPRT)启动,该过程发生在基因组的切口处,随后合成互补DNA(cDNA)并整合到新的位置。最近的结构研究揭示了ORF2的生化结构,明确了其模板和靶点位点。L1在人类基因组中占据约17%,拥有约50万个拷贝,但其中大部分是截断或突变的,只有约100个拷贝仍具备逆转录能力。尽管如此,数百到数千个L1元件仍保持转录活性,并可能作为DNA调控元件,影响基因表达。
Alu是一种SINE(短散在核元件)亚家族,长度约为300个碱基对,源自7SL RNA基因。Alu元件具有两个内部重复序列,中间由一个短的间隔区隔开。其中,AluY是最近期和活跃的亚家族,其次是AluS和AluJ。AluY在人类基因组进化和基因调控中起着重要作用。Alu本身并不编码其自身移动所需的蛋白,而是依赖于L1编码的ORF2进行逆转录和基因组整合。Alu RNA(由Pol III转录)能够利用L1的酶系统,在细胞中进行转录并整合到基因组中。尽管Alu依赖于L1,但其插入频率与L1相当,估计每出生1:200–1:20的频率。这一现象表明,Alu虽然不能自主移动,但其活跃性与L1密切相关。
SINE-可变串联重复(VNTR)-Alu(SVA)是灵长类特有的最年轻转座子家族。它由类似Alu的序列和SINE-R序列组成,中间由VNTR序列隔开。SVA约占人类基因组的0.2%,并分为SVA-A到SVA-F多个亚家族。SVA与Alu一样,属于非自主逆转录转座子,其RNA(由Pol II转录)利用L1编码的ORF2进行逆转录和整合,估计插入频率为每出生1:500–1:63。这表明,尽管SVA不能自主移动,但其活跃性仍然与L1密切相关,并可能对基因组结构和功能产生重要影响。
长末端重复(LTR)逆转录转座子通常位于基因组的两侧,被认为是远古RNA病毒的残留物,这些病毒曾感染祖先基因组。例如,人类内源性逆转录病毒(HERVs)就是LTR逆转录转座子的代表。根据其引物结合位点所使用的tRNA类型,这些逆转录转座子可以被分类。例如,HERVK是一组使用赖氨酸(K)tRNA作为引物的内源性逆转录病毒,而HERVH使用组氨酸(H)tRNA。在进化过程中,这些元件积累了突变、内部缺失和重组,导致其蛋白编码序列的丧失,从而无法形成功能性的病毒样颗粒或产生逆转录酶,使其失去重新整合的能力。因此,这些非活跃的LTR在基因组中固定下来,可能仍然调控基因表达或染色质结构,但已丧失其移动能力。
在分子机制方面,转座子的活性受到多层调控系统的严格控制。这种调控系统包括DNA甲基化、组蛋白修饰、染色质重塑、转录因子、RNA干扰、RNA修饰和DNA损伤修复等。这些机制协同作用,以确保转座子的活动在时间和空间上受到精确调控。然而,这些调控因子如何协调以实现对个体转座子的精准控制,以及它们在不同物种或细胞类型中是否存在特定的调控层级,仍是未解之谜。此外,哪些转座子亚群最与疾病发展相关,也需要进一步研究。
转座子的多重调控功能体现在其对染色质结构、转录网络、RNA加工和先天免疫反应的调节。它们的活动不仅影响基因组的复杂性,还推动了基因调控的进化。在发育过程中,转座子的插入可能改变基因表达,导致功能丧失、蛋白质产物改变和基因组不稳定性。在乳腺癌和结直肠癌中,L1插入到抑癌基因或癌基因(如腺瘤性息肉病基因)可能促进癌症的发生,通过干扰正常的基因表达和细胞调控。Alu插入则可能影响神经递质受体和生长因子的表达,从而影响突触可塑性。
转座子还可能作为增强子发挥作用,通过多种机制调控基因表达。例如,年轻的L1亚家族的5′-UTR区域显示出更强的STARR-seq富集,表明其具有更大的增强子潜力。这些增强子可能通过物理接触远端基因来调控其表达。此外,L1 RNA和DNA能够通过诱导异染色质蛋白1α的相分离,促进异染色质区隔化和L1富集区域的沉默。HERVH和L1元素能够独立于CTCF形成拓扑关联结构域(TAD)边界,其功能与转录活性密切相关。此外,转座子的增强子活动可能影响染色质结构,从而影响基因表达和细胞功能。
转座子的活动还可能影响免疫反应。它们能够激活先天免疫系统,例如通过L1衍生的双链RNA(dsRNA)激活RIG-I和MDA5,从而触发I型干扰素(IFN)反应。HERVK也能激活RNA传感器如TLR7和TLR8,以及DNA传感器如cGAS和AIM2。此外,转座子在T细胞发育和功能中也发挥着作用,它们作为调控序列影响T细胞受体信号和分化。HERV衍生的序列可能调控关键细胞因子和转录因子如FOXP3,这对调节性T细胞的发育和维持免疫耐受至关重要。
尽管转座子在正常免疫功能中具有重要作用,但其异常激活可能导致免疫相关疾病,如自身免疫和慢性炎症。例如,在慢性感染中,转座子的激活可能导致T细胞耗竭,从而影响免疫监视和应答。在系统性红斑狼疮(SLE)、类风湿性关节炎(RA)和多发性硬化症(MS)等疾病中,转座子的过度激活可能诱导基因组不稳定性,导致持续性炎症。在SLE中,异常激活的L1和HERV可能产生双链RNA和转座子衍生的转录物,从而放大I型IFN反应。此外,HERVK在RA中可能通过其在滑膜成纤维细胞中的表达促进细胞因子产生和免疫细胞浸润到关节中。尽管转座子的激活在急性病毒感染中也可能被观察到,但其功能意义仍需进一步研究。
在衰老和与衰老相关的疾病中,转座子的活动增加并导致基因组不稳定性。衰老的神经元中,L1的激活可能导致DNA损伤和双链断裂,而这些断裂在衰老细胞中修复效率低下。这种DNA损伤的积累可能影响细胞功能并促进衰老过程。慢性、低水平的炎症是衰老的另一个显著特征,转座子通过激活免疫反应促进这种炎症。例如,在早衰模型中,重新激活的HERVK可能通过激活cGAS-STING通路促进细胞衰老。此外,衰老过程中L1 DNA的积累可能触发I型IFN反应,从而促进与年龄相关的炎症。值得注意的是,核苷逆转录酶抑制剂可能减少这种效应,表明L1可能是缓解年龄相关炎症疾病的潜在治疗靶点。
在癌症中,转座子的重新激活可能导致体细胞逆转录和基因组不稳定性。转座子的插入可能破坏编码或调控区域,从而导致癌基因或抑癌基因的突变。此外,转座子的激活可能与拷贝数变异(CNVs)相关,这些变异在癌症中普遍存在,并与不良预后相关。尽管转座子具有促进肿瘤发展的功能,但它们也可能通过诱导基因组不稳定性、激活DNA损伤反应等方式发挥肿瘤抑制作用,特别是在髓系白血病中。此外,转座子衍生的RNA和其逆转录产物(互补单链DNA或DNA/RNA杂交)可能激活核酸感应通路,包括RNA受体如RIG-I样受体、Toll样受体3和DNA传感器cGAS。转座子与宿主的融合RNA的翻译可能生成新的肽,从而扩大肿瘤抗原的范围。因此,转座子能够刺激先天免疫传感器并生成肿瘤特异性抗原,使其成为癌症免疫治疗的潜在靶点。
在诊断和治疗方面,转座子因其疾病特异性激活模式和免疫特性而展现出重要价值。它们可以作为诊断标志物,例如在癌症和神经退行性疾病中,转座子的重新激活可能与疾病进展和治疗反应相关。在阿尔茨海默病(AD)和帕金森病(PD)等神经退行性疾病中,L1和HERV的重新激活可能与神经炎症和神经退行性变化相关,因此可能用于监测疾病进程。此外,针对转座子的治疗策略,如通过表观遗传调控、免疫检查点阻断或RNA干扰,可能有助于提高癌症治疗效果。然而,转座子的治疗应用仍面临挑战,例如肿瘤细胞中转座子表达的异质性和免疫逃逸机制。
为了克服这些挑战,技术的创新正在推动转座子靶向治疗的发展。单细胞RNA测序(scRNA-seq)和长读长测序技术能够以高分辨率描绘转座子的动态变化和其在细胞中的功能。例如,scRNA-seq可以揭示转座子如何影响细胞分化、免疫反应和肿瘤进展。而长读长测序技术能够准确组装完整的转座子序列,并检测其移动事件和基因组重排。尽管这些技术在转座子研究中具有巨大潜力,但它们通常成本较高且难以量化。因此,进一步优化这些技术对于实现转座子研究的临床转化至关重要。
机器学习的发展为转座子分析提供了新的工具。基于多组学数据的机器学习算法在识别免疫原性转座子衍生的表位方面展现出巨大潜力。例如,NeoFuse和nextNEOpi等工具利用线性回归和人工神经网络等算法,从包含转座子的RNA中预测新抗原。这些计算工具能够提高高通量筛选的效率,但它们的临床应用仍需进一步验证,例如通过与实验数据的交叉比对来优化模型。
随着对转座子生物学的深入理解,新的治疗策略正在不断涌现。例如,最近在人类基因组中发现了40种新的具备整合能力的DNA转座子,并开发了相应的分子工具包,这为基于转座子的治疗应用提供了新的思路。因此,随着对转座子基础生物学的深入研究,这些发现正在推动基因组工程和靶向治疗的创新,为新型预后标志物和靶向治疗提供机会。
总之,转座子曾被认为是“垃圾DNA”,但现在被广泛认可为调控人类生物学的重要动态元件。它们的活动不仅影响神经发育、免疫反应和衰老,还与多种疾病的发生发展密切相关。随着单细胞组学、长读长测序和机器学习技术的进步,我们对转座子活动和其在健康与疾病中的作用有了前所未有的认识。尽管临床转化仍面临挑战,如细胞类型特异性及脱靶效应,转座子在精准医学中的潜力仍然巨大,能够将遗传变异、基因调控和疾病机制紧密联系起来,为未来的研究和治疗提供新的方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号