常见遗传变异对大脑基因表达的影响:从RNA到蛋白质与精神分裂症风险
《Nature Communications》:Impact of common variants on brain gene expression from RNA to protein to schizophrenia risk
【字体:
大
中
小
】
时间:2025年11月29日
来源:Nature Communications 15.7
编辑推荐:
本研究通过整合大脑前额叶皮层的转录组、核糖体占据组和蛋白质组多组学数据,系统解析了常见遗传变异在中心法则各层面的传递规律。研究发现仅有34%的表达数量性状位点(eQTL)效应能传递至蛋白质水平,表明存在广泛的转录后衰减现象。通过孟德尔随机化等方法,研究人员确定了74个精神分裂症(SCZ)风险基因,其中52个通过转录组发现,68%对蛋白质表达影响有限。该研究为理解神经精神疾病的分子机制提供了新视角。
在我们探索复杂疾病遗传基础的道路上,精神分裂症(SCZ)作为一个遗传度高达60-80%的神经精神疾病,一直是科学家们关注的焦点。尽管全基因组关联分析(GWAS)已发现数百个风险位点,但大多数位于非编码区,使得识别真正的致病基因和变异变得困难。传统研究多依赖于转录组数据,然而基因的生物学功能最终需要通过蛋白质来执行。这就引出一个关键问题:影响转录水平的遗传变异,其效应是否能够、以及在多大程度上可以传递到蛋白质水平?这个问题的答案对于理解疾病机制和开发有效治疗方案至关重要。
为了回答这个问题,研究人员在《Nature Communications》上发表了最新研究成果。他们利用来自BrainGVEX队列的211例人脑前额叶皮层样本,首次在同一批个体中同时获得了单核苷酸多态性(SNP)基因分型、RNA测序(RNA-Seq)、核糖体分析(Ribo-seq)和定量蛋白质组学数据,覆盖了中心法则(Central Dogma)的主要环节。
研究团队主要采用了以下几种关键技术方法:通过核糖体分析技术量化转录组范围内的核糖体占据水平,作为蛋白质合成的指标;利用QTLtools进行顺式数量性状位点(cis-QTL)作图,识别与转录水平(eQTL)、核糖体占据水平(rQTL)和蛋白质水平(pQTL)相关的遗传变异;应用多组学整合分析方法,包括共定位分析(coloc)、S-PrediXcan和孟德尔随机化(MR),探究不同分子层面对疾病风险的贡献。
多组学cis-QTL作图识别候选调控变异并揭示eQTL效应的翻译和翻译后衰减
通过独立对每种组学类型进行cis-QTL作图,研究人员在FDR<0.1水平分别识别出12,411个eQTL(对应16,540个基因)、2,849个rQTL(对应14,572个基因)和1,036个pQTL(对应8,013个基因)。值得注意的是,pQTL中编码变异的比例最高(11.5%),而eQTL和rQTL分别为3.4%和5.1%。
为了比较不同数据模态间的遗传调控效应,研究人员聚焦于在所有三种组学类型中均得到充分定量的7458个基因的子集数据。结果显示,随着沿中心法则向下游移动,识别出的显著QTL数量逐渐减少。复制分析揭示了不对称的复制率:84.7%的rQTL在转录水平被复制,但只有60.2%的eQTL在核糖体占据水平被复制;75.9%的pQTL在转录水平被复制,而仅有34.0%的eQTL在蛋白质水平被复制。
使用来自CommonMind Consortium(CMC)独立识别的eQTL进行分析,发现这些eQTL变异对转录表达水平的效应(每个等位基因log2折叠差异:0.2433)显著大于对核糖体占据水平的效应(0.1836),后者又显著大于对蛋白质水平的效应(0.1486)。这表明eQTL效应在核糖体占据水平(翻译调控)和蛋白质水平(翻译后调控)均存在衰减。
识别组学特异性QTL及其与脑疾病GWAS的信号共定位
为了评估不同QTL类型在脑相关复杂性状中的相关性,研究人员应用介导表达评分回归(MESC)分析了四种不同脑疾病的GWAS摘要统计数据。对于精神分裂症(SCZ)、双相情感障碍(BD)和自闭症谱系障碍(ASD),eQTL介导的遗传度最高,其次是rQTL和pQTL。例如,eQTL介导了SCZ遗传度的7.09%,rQTL介导了4.06%,pQTL介导了2.17%。
通过多元回归方法,研究识别出组学特异性QTL:1553个基因具有表达特异性QTL(esQTL),155个基因具有核糖体占据特异性QTL(rsQTL),161个基因具有蛋白质特异性QTL(psQTL)。psQTL中编码变异(28%)和错义变异(占编码变异的97.8%)的比例显著高于其他QTL类型。
通过基因水平的PrediXcan方法,研究人员进一步识别出382个主要具有esQTL效应的基因、36个具有rsQTL效应的基因和51个具有psQTL效应的基因。与脑相关复杂疾病GWAS的共定位分析发现,大多数信号共定位发生在esQTL与复杂疾病之间。
应用S-PrediXcan于Trubetskoy等人的SCZ GWAS数据和BrainGVEX多组学数据,在5%家族错误率下,分别从RNA-Seq、ribo-seq和蛋白质组学数据中识别出52、29和16个SCZ风险基因。仅有四个基因(NEK4、KHK、CNNM2和DARS2)在所有三种组学类型中均被一致识别为SCZ风险基因。
在74个通过S-PrediXcan识别的风险基因中,44个此前已在GWAS研究中被报道。值得注意的是,30%(22个)的风险基因与已知风险基因列表不匹配,这些基因具有相对较弱的SCZ GWAS信号,如果没有多组学QTL数据集提供的额外信息,很难被识别。
为了验证S-PrediXcan识别的风险基因,研究人员进行了两样本孟德尔随机化(MR)分析。在10% FDR下,97个基因-组学组合中有67.0%(65/97)通过了MR检验。总共53个风险基因在至少一种组学类型中得到了复制。
为了进一步阐明这53个复制的SCZ风险基因的潜在因果机制,研究人员使用单样本MR推断QTL类型间的因果关系。结果显示,21个基因在从eQTL到rQTL和从rQTL到pQTL的通路中均显示显著因果效应(双通过风险基因);23个基因仅在一个通路中显示显著因果效应(单通过风险基因);7个基因没有显示显著因果效应(未通过风险基因)。
研究发现,例如SF3B1具有eQTL与SCZ GWAS之间的强信号共定位,但在ribo-seq或蛋白质组学数据中没有明显的QTL信号,表明存在转录特异性调控机制。
这项研究通过整合多组学数据,系统解析了常见遗传变异在中心法则各层面的传递规律,首次在人脑组织中发现了eQTL效应在翻译水平的明显衰减。研究结果表明,许多疾病相关变异通过并不导致蛋白质水平可观察影响的调控机制发挥作用,这对当前主要依赖转录组数据识别疾病风险基因的策略提出了重要挑战。
研究发现仅有34%的eQTL效应能传递至蛋白质水平,强调了在识别疾病风险基因时考虑多组学数据的重要性。通过多方法验证,研究确定了74个SCZ风险基因,其中30%为新发现基因,展示了多组学方法在发现弱GWAS信号位点风险基因方面的优势。
这些发现不仅深化了我们对遗传变异调控基因表达的理解,也为未来神经精神疾病研究提供了重要方向:需要考虑转录后调控机制在疾病 etiology 中的作用;开发整合多组学数据的新方法将提高风险基因识别的准确性;直接测量蛋白质合成速率和周转率可能揭示新的调控层。
总的来说,这项研究为我们理解遗传变异如何通过不同分子层面影响脑功能和相关疾病风险提供了宝贵见解,为未来诊断和治疗策略的开发奠定了重要基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号