CRESTA:全面解析细胞应激反应的转录组图谱,为环境毒性机制与药物重定位提供新视角

【字体: 时间:2025年10月01日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本研究针对细胞应激反应(CSR)研究数据零散、缺乏标准化整合的问题,开发了综合数据库CRESTA。研究者通过整合8258个样本的转录组数据,系统分析了14大类环境应激源诱导的20786个应激相关基因,并关联功能通路、细胞死亡模式与疾病表型。该数据库支持应激机制解析、毒性预测及FDA批准药物的重定位研究,为环境健康与疾病治疗提供重要资源。

  
当我们暴露在高温、辐射、重金属或营养匮乏等环境压力下时,人体细胞会启动一套精细的防御机制——细胞应激反应(Cellular Stress Response, CSR),以维持内部稳态。一旦这种反应失效,便可能导致细胞死亡乃至一系列疾病,如癌症、神经退行性疾病和呼吸系统疾病。尽管CSR的重要性已被广泛认识,但科学界仍面临一个严峻挑战:相关研究数据分散、标准不一,且缺乏系统性整合。现有数据库如CTD、iHypoxia或RadAtlas,往往只覆盖有限的应激类型或分子机制,无法提供全景式的CSR转录组图谱,严重制约了对应激机制的深入理解和临床应用。
为此,来自中山大学等机构的研究团队在《Nucleic Acids Research》上发表了CRESTA(Comprehensive Transcriptome Atlas for Cellular Response to External Stressors)数据库,旨在构建一个统一、多层次、注释丰富的CSR转录组资源库。该研究整合了来自274项研究、8258个样本的转录组数据,涵盖197种人类细胞类型和14大类环境应激源(如空气污染物、抗癌药物、重金属、缺氧、机械刺激等),通过系统的差异表达分析和多层级排名聚合方法,鉴定出20,786个应激相关基因。CRESTA不仅提供基因与应激源的关联信息,还进一步链接至功能通路、细胞死亡模式、疾病关联以及药物扰动数据,支持从基础机制研究到药物重定位的多维度探索。
研究团队运用了几项关键技术构建CRESTA。首先,从GEO(Gene Expression Omnibus)数据库手动筛选并注释了符合条件的人类细胞转录组研究,确保数据覆盖多样应激条件和细胞类型。随后,采用标准化分析流程:对RNA-seq数据使用DESeq2(v1.44.0)进行差异表达分析,对微阵列数据使用Limma(v3.60.3)处理,以log2FC > 1且P-value < 0.05作为显著差异阈值。为整合多数据集结果,应用Robust Rank Aggregation(RRA)方法计算基因排名得分,识别出在各应激条件下一致上调或下调的基因。此外,通过多种数据库(如GO、KEGG、Reactome、RCDdb、DisGeNET、ClinVar等)对应激相关基因进行功能注释,包括CSR相关通路、调控性细胞死亡、转录因子、疾病关联和组织表达模式,并利用CMap(Connectivity Map)分析支持药物重定位推断。
数据库内容方面,CRESTA收录了14大类应激源诱导的转录组响应,包括20,786个独特基因。层级结构分析显示,不同应激类别所诱导的基因重叠度低(Jaccard相似性<20%),表明应激响应具有高度特异性。值得注意的是,超过50%的各应激类别Top 100基因尚未被深入研究,凸显了CRESTA在发现新靶点方面的价值。
对应激相关基因的功能特性分析揭示了CSR的核心机制。KEGG富集分析显示,免疫与炎症反应通路(如TNF signaling pathway、NF-kappa B signaling pathway)是最常被激活的路径,而细胞周期调控则普遍受到抑制。在六类核心CSR机制中,未折叠蛋白反应(UPR)是最广泛被诱导的,而DNA损伤反应(DDR)则最常被抑制。调控性细胞死亡模式中,凋亡(apoptosis)富集程度最高。转录因子分析进一步识别出AP-1(如ATF4、JUN)和NF-κB(如NFKB1、RELA)家族作为CSR转录调控的关键因子。
应用层面,CRESTA支持系统性探索应激-疾病关联与药物重定位。以重金属暴露与阿尔茨海默病(AD)的关联为例,富集分析显示AD与重金属诱导的基因签名具有最强关联性。CRESTA识别出202个重叠基因,其中HMOX1、MT2A、HSPA1B等已有文献支持,而SLC2A3、SERPINE2等则提示了新的机制研究方向。通过CMap分析,研究者进一步筛选出可能逆转重金属诱导AD转录组特征的化合物,如PD-0325901(FDA批准)、saracatinib和equilin等,为药物重定位提供了候选分子。
CRESTA还提供了用户友好的网络界面(https://cresta.renlab.cn/),包括浏览页面(按应激类别、亚类、细胞类型分层展示)、搜索功能(支持基因过滤与层级选择)和详细信息页面(涵盖基因基础信息、通路参与、疾病关联、表达模式等)。
研究团队还以“机械刺激可能通过HSPH1相关UPR影响黑色素瘤进展”为例,演示了如何利用CRESTA从选择靶基因、验证肿瘤关联到推断CSR机制的完整研究假设生成流程。
综上所述,CRESTA作为目前最全面的CSR转录组图谱,通过整合多源数据、标准化分析流程和丰富注释,突破了现有资源的局限。它不仅揭示了应激响应的特异性和复杂性,还为机制研究、毒性预测和药物发现提供了强大支持。未来,随着AI驱动数据收集、机器学习评分等技术的引入,CRESTA有望进一步拓展其在空间转录组和多组学整合中的应用,成为环境健康与疾病研究领域不可或缺的基础资源。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号