
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人类选择性剪接的结构影响预测:基于AlphaFold2的大规模异构体结构建模与功能解析
【字体: 大 中 小 】 时间:2025年09月18日 来源:Genome Biology 9.4
编辑推荐:
本文利用AlphaFold2对超过11,000个人类选择性剪接异构体进行结构预测,系统分析了剪接事件对蛋白质结构特征(如模板匹配评分、二级结构组成、表面电荷分布、回转半径等)的影响,并结合单细胞RNA测序数据揭示了异构体在细胞类型特异性表达模式及其对翻译后修饰位点可及性和功能预测的深远意义,为理解选择性剪接在人类细胞功能多样性中的作用提供了重要资源。
近年来,神经网络驱动的蛋白质结构预测方法(如AlphaFold2)虽已成功预测人类蛋白质组结构,但多数研究仅关注每个基因的单一异构体,忽略了剪接变异体的结构多样性。本研究从UniProt数据库筛选出11,159个人类剪接异构体(序列长度≤600氨基酸),利用AlphaFold2进行结构预测,并与AlphaFold蛋白质结构数据库中5,966个参考异构体进行对比。通过分析多序列比对(MSA)深度与预测局部距离差异测试(pLDDT)评分的关系,发现可变剪接区域(尤其是被替换区域)的MSA深度显著低于非剪接区域,且pLDDT评分与MSA深度呈正相关(参考异构体PCC=0.475,交替异构体PCC=0.529)。尽管交替异构体的平均pLDDT略低于参考异构体,但通过实验验证的9对异构体-参考结构对显示,AlphaFold2预测的TM-score和RMSD在统计学上无显著差异(配对t检验p值分别为0.76和0.32),表明预测结果具有可靠性。
通过计算异构体与参考序列的序列同一性和结构TM-score,发现两者呈正相关(PCC=0.565)。然而,存在328个异构体在序列同一性>70%的情况下TM-score<0.5,其中53个高置信度结构显示剪接导致显著结构变化,包括螺旋取向改变(如CENPX、SNAP23)、重复结构域丢失(如SIGLEC8、CFHR3)和结构紧凑性变化(如LIAS、NDRG2)。以CFHR3为例,其异构体2剪接掉一个Sushi结构域,导致细胞因子结合功能可能受损;而MDH2异构体2剪除144-185残基(螺旋区域),不仅导致结构松散,还破坏了关键的苹果酸结合位点176R。
二级结构分析表明,多数剪接类型对螺旋、折叠和环状结构的比例影响较小,但可变首外显子(AFE)事件倾向于增加螺旋比例、减少环状结构。表面电荷分析显示,尽管整体分布无显著差异(曼-惠特尼U检验p=0.304),但231个异构体表面电荷显著增加(正异常值),214个显著减少(负异常值)。例如CXCR3异构体2因AAS事件插入47个残基,掩蔽了天冬氨酸残基(99D、159D、325D),导致表面正电荷增加,与其配体结合偏好转变(从CXCL9/10/11转向CXCL4)一致。回转半径分析表明,交替异构体的中位值略低于参考异构体(22.0 ? vs 22.9 ?),且外显子跳过(ES)和可变末外显子(ALE)事件更易导致回转半径减小。
通过分析磷酸化、泛素化等7类翻译后修饰(PTM)位点的相对溶剂可及性(RSA),发现587个PTM位点从参考结构的暴露状态转变为异构体的埋藏状态,1,358个位点则从埋藏变为暴露。典型案例如CDK1异构体中15T磷酸化位点因螺旋丢失从埋藏(RSA=20.8 ?2)变为暴露(RSA=175.6 ?2);而TGFBR1异构体中200T位点因环区取向变化从暴露(RSA=79.1 ?2)转为埋藏(RSA=16.5 ?2)。尤其值得注意的是BAX基因:其参考异构体(BAX-α)中184S磷酸化位点深埋于螺旋内部(RSA=1.18 ?2),而异构体BAX-δ中对应位点135S完全暴露(RSA=55.5 ?2),且极性接触网络简化,可能影响AKT1介导的磷酸化调控凋亡功能。生存分析显示BAX-δ高表达与肾透明细胞癌、肝细胞癌和间皮瘤的较高生存率相关,但与卵巢浆液性囊腺癌的较低生存率相关。
整合Tabula Sapiens单细胞RNA测序数据,发现33个基因的71个异构体存在显著的细胞类型特异性表达切换。例如肌球蛋白轻链6(MYL6)平滑肌型与非肌型异构体在不同细胞类型中差异表达;KDELR1异构体2在泪腺功能单元细胞和中性粒细胞中高表达,虽缺失62个残基但保留溶酶体富集 motif(关键识别结构)。超氧化物歧化酶SOD2异构体2在肌肉细胞、基质细胞和血管内皮细胞中高表达,但其98H锰离子结合位点丢失,可能导致活性降低。
使用COFACTOR进行基因本体(GO)术语预测,发现交替异构体更易丢失功能术语(935个丢失 vs 226个获得)。功能获得多与脂质代谢过程(GO:0006629)、微管细胞骨架(GO:0015630)等术语相关,而功能丢失显著富集于化学响应(GO:0042221)、转录调节活性(GO:0140110)等过程。例如EPHX2异构体2因N端53个残基缺失,预测丢失酯键水解酶活性(GO:0016788)和脂质代谢过程(GO:0006629)功能;TAFAZZIN异构体7因外显子5和7缺失,预测丧失酰基转移酶活性(GO:0003841)。相反,RGN异构体2因结构域丢失形成更大结合口袋,预测获得酯水解酶活性新功能。
本研究通过大规模结构预测和多维度量分析,揭示了选择性剪接通过改变蛋白质结构影响功能的多种机制。尽管AlphaFold2在预测剪接区域结构时受MSA深度限制,且无法完全捕捉动态构象和蛋白质复合物效应,但其提供的结构视角仍为理解异构体功能多样性奠定了重要基础。结合单细胞表达数据,工作不仅验证了已知剪接事件(如MYL6、TPM家族),还发现了新型细胞类型特异性表达模式(如KDELR1、SOD2)。未来研究可进一步探索剪接对蛋白质-蛋白质相互作用(PPI)和域架构的影响,推动异构体功能注释的精准化。
生物通微信公众号
知名企业招聘