-
生物通官微
陪你抓住生命科技
跳动的脉搏
Cell发布新资源,有助于了解基因变异的功能影响
【字体: 大 中 小 】 时间:2023年04月03日 来源:生物通
编辑推荐:
一个由近百名科学家组成的国际团队近日以四名欧洲裔个体为研究对象,确定了基因变异在20多种组织类型中的功能。
了解基因变异如何影响分子表型是功能基因组学的主要目标之一。一个由近百名科学家组成的国际团队近日以四名欧洲裔个体为研究对象,确定了基因变异在20多种组织类型中的功能。
这些个体之前参与了基因型组织表达(GTEx)项目。耶鲁大学的Mark Gerstein及其同事利用PacBio的长读长序列、Oxford Nanopore的长读长序列、10x Genomics的分析数据及Illumina的短读长序列生成了代表母系和父系单倍型的基因组序列。之后再结合约30种组织的功能基因组学分析结果对序列数据进行分析。
研究团队于3月30日在《Cell》杂志上发表了由此产生的EN-TEx数据集。与相应的统计和深度学习模型相结合,EN-TEx有望帮助人们注释个人基因组序列中的变异对各个组织的影响。
Gerstein解释说:“有了EN-TEx中的高质量基因组和匹配组织数据,这份目录可以帮助人们以精准的方式确定变异的影响,因为在比较母系和父系单倍型时会有一个‘自然控制’。这份目录帮助我们开发出可归纳的变异影响模型。”
研究人员表明,有了这些模型,他们可以突出在表达数量性状位点(eQTL)中过度代表的调控元件,或通过全基因组关联研究(GWAS)确定的基因座。例如,他们可以标记出对调控影响最大的变异所在的基因组部分。
“令人惊讶的是,一个深度学习的转化器模型能够仅仅根据核苷酸序列背景来预测等位基因的特异性活性,这突出了对变异特别敏感的转录因子结合元件的重要性,”作者报告说。“此外,将EN-TEx与现有的基因组注释相结合,揭示了等位基因特异性位点和GWAS位点之间的关联。”
Gerstein表示,新开发的EN-TEx模型还有另一个作用,也就是将在一种容易获取的组织(如血液)中发现的eQTL效应转移到另一种组织或器官类型,“这是对GTEx eQTL目录的重大扩展,将未确定的变异与已知功能的基因联系起来”。
因此,这项工作扩展了早期一些了解基因组中调控元件及其影响的工作,如GTEx或ENCODE,带来了广泛的分析工具、变异类型和数据集,可系统评估100多万个等位基因特异性位点。
Gerstein指出,EN-TEx资源目前还不包括脑组织的数据。他认为,扩大这项工作,加入更多组织的数据以及其他非欧洲人群的数据集,将会大有裨益。
“将EN-TEx方法扩展到更多个体,允许人们开展类似QTL的研究,然后加入不同血统的个体,这将会变得更强大,”他指出,目前的EN-TEx资源是免费提供给其他研究人员的。
“我们设想在不久的将来,随着测序成本的降低,生成一个匹配的个人基因组序列来伴随每个功能基因组学实验将成为常态,”作者写道,并指出“通过EN-TEx个性化方法来分析基因组变异的影响将成为普遍现象,有望为精准医疗带来好处”。
原文检索
The EN-TEx resource of multi-tissue personal epigenomes & variant-impact models
DOI: https://doi.org/10.1016/j.cell.2023.02.018