-
生物通官微
陪你抓住生命科技
跳动的脉搏
未知组——探索人们几乎一无所知的蛋白质
【字体: 大 中 小 】 时间:2023年08月11日 来源:AAAS
编辑推荐:
英国研究人员近日建立了一个公开数据库。不过令人惊讶的是,他们希望数据库的内容随着时间的推移不断缩小,而不是扩大,因为这个数据库包含了数千个由人类基因编码的蛋白质,它们的存在是已知的,但它们的功能是未知的。
英国的研究人员近日建立了一个公开数据库。不过令人惊讶的是,他们希望数据库的内容随着时间的推移不断缩小,而不是扩大,因为这个数据库包含了数千个由人类基因编码的蛋白质,它们的存在是已知的,但它们的功能是未知的。因此,这个数据库被称为未知组(unknome)。
MRC分子生物学实验室的Sean Munro和牛津大学的Matthew Freeman领导了这项研究,并在《PLOS Biology》杂志上发表了论文。通过对部分蛋白质的研究,他们发现大多数蛋白质参与重要的细胞功能,包括生育和发育。
人类基因组大约编码2万个蛋白质,其中许多还没有表征。科学研究往往集中在一些研究透彻的蛋白质上,导致人们担心了解不多的基因会被彻底忽视。为了解决这个问题,研究人员开发出一个公开的未知组数据库(www.unknome.org),按照人们对蛋白质的不了解程度对它们进行排序。
这个数据库为每种蛋白质分配了一个“已知程度(knownness)”评分,反映了科学文献中关于功能、保守性、亚细胞定位及其他元素的信息。根据这个系统,大约数千种蛋白质的已知程度几乎为零。数据库对所有人开放,并且可定制,允许用户为不同元素设置自己的权重,并生成自己的一组已知程度评分。
为了测试数据库的作用,研究团队选择了260个人类基因,它们在果蝇中有类似的基因,并且在两个物种中的已知程度评分为1或更低,表明对它们几乎一无所知。利用RNAi筛选技术,他们系统表征了在果蝇中敲除这些蛋白质的后果。
他们发现,对于大部分蛋白质来说,完全敲除基因会造成果蝇死亡。部分敲除或组织特异性敲除结果显示,多种蛋白质参与了生育、发育、组织生长和应激反应。
研究人员之后采用CRISPR-Cas9基因编辑技术来验证RNAi筛选发现的部分功能作用。例如,在分析CG11103基因(对应人类的TM2D2基因)编码的蛋白质时,他们发现了Notch信号通路的作用,缺乏该基因的果蝇在翅膀发育方面会出现变化。
此次筛选还突出了与生育能力有影响的基因。研究人员分别敲除了雄性或雌性果蝇生殖系中198个功能未知的基因,随后对这些果蝇进行长期追踪,以了解它们的生育特征。在利用CRISPR-Cas9基因编辑技术进行验证后,他们突出了两个保守基因,对雄性果蝇的生育能力至关重要。
这些研究结果表明,未来有可能通过系统挖掘未知组数据库收集到的“被忽视”蛋白质,发现对新颖或已知的生物过程有贡献的蛋白质。
Munro表示:“未知组数据库是我们工作的一个重要方面,因为我们希望其他人将其作为一种工具来选择有意思但未被充分研究的蛋白质。它还可以帮助人们快速了解感兴趣的蛋白质在其他物种中的‘亲戚’。”
原文检索
Rocha JJ, Jayaram SA, Stevens TJ, Muschalik N, Shah RD, Emran S, et al. (2023) Functional unknomics: Systematic screening of conserved genes of unknown function. PLoS Biol 21(8): e3002222. https://doi.org/10.1371/journal.pbio.3002222