-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature:首次组装完整的人类Y染色体序列
【字体: 大 中 小 】 时间:2023年08月24日 来源:Nature
编辑推荐:
科学家们成功地对整个人类Y染色体进行了测序,揭示了关键的基因组特征。这项开创性的研究为人类生物学和潜在的医学进步提供了深刻的见解。
Y染色体是人类24条染色体中最后一个完成测序的。一个国际研究小组生成了第一个真正完整的人类Y染色体序列。新的序列填补了Y染色体长度的50%以上的空白,揭示了与生育能力有关的重要基因组特征,比如精子产生的因素。这项研究是由端粒到端粒(T2T)联盟领导的,该联盟是由美国国立卫生研究院下属的国家人类基因组研究所(NHGRI)资助的一个研究小组,该研究将于今天(8月23日)在《Nature》杂志上发表。
Y染色体的复杂作用
Y染色体和X染色体在性发育中的作用经常被讨论。虽然这些染色体起着核心作用,但与人类性发育有关的因素遍布整个基因组,而且非常复杂,从而产生了在男性、女性和双性人之间发现的一系列人类性特征。这些类别不等同于性别,性别是一个社会类别。此外,最近的研究表明,Y染色体上的基因对人类生物学的其他方面也有影响,比如癌症的风险和严重程度。
20年前,当研究人员完成第一个人类基因组序列时,所有24条染色体的序列都留下了空白。然而,与T2T联盟去年填补的散布在其余基因组序列上的小空白不同,Y染色体序列的一半以上仍然是一个谜。
所有的染色体都有一些重复的区域,但Y染色体是不同寻常的重复,使得它的序列特别难以完成。组装测序数据就像试图阅读一本被切成条的长书。如果书中所有的行都是唯一的,就更容易确定行进入的顺序。然而,如果同一个句子被重复了数千次或数百万次,那么条带的原始顺序就不那么清楚了。虽然所有的人类染色体都含有重复序列,但Y染色体上大约有3000万个字母是重复序列。这就好像同样的几句话被重复了一半的篇幅。
为了解决人类基因组中最重复的片段,T2T联盟应用了新的DNA测序技术和序列组装方法,以及从生成其他23条人类染色体的第一个无间隙序列中获得的知识。
“最令人惊讶的是重复的组织方式,”NHGRI的高级研究员、该联盟的负责人Adam Phillippy博士说。“我们不知道到底是什么弥补了缺失的片段。它可能是非常混乱的,但相反,近一半的染色体是由两个特定重复序列的交替块组成的,称为卫星DNA。它的图案很漂亮。”
完整的Y染色体序列也揭示了医学相关区域的重要特征。Y染色体的一个这样的部分被称为无精子症因子区域,这是一段DNA,包含几个已知与精子产生有关的基因。利用新完成的序列,研究人员研究了无精子症因子区域一组反向重复序列或“回文”的结构。
“这种结构非常重要,因为偶尔这些回文可以产生DNA循环,”NHGRI的工作人员科学家、《Nature》杂志的第一作者Arang Rhie博士说。“有时,这些环意外地被切断,并在基因组中造成缺失。”
已知无精子症因子区域的缺失会破坏精子的产生,因此这些回文可能会影响生育能力。有了完整的Y染色体序列,研究人员现在可以更精确地分析这些缺失及其对精子产生的影响。
其他与潜在医学相关的区域包含重复的基因。人类基因组中的大多数基因都有两个拷贝,分别来自父母双方。然而,一些基因有许多拷贝沿着DNA的延伸重复,有时被称为“基因阵列”。
研究人员集中研究了另一种被认为与精子产生有关的基因TSPY。TSPY的拷贝被组织在人类基因组的第二大基因阵列中。与其他重复区域一样,重复基因的分析具有挑战性,因此,虽然已知TSPY存在许多重复拷贝,但该阵列的特定DNA序列和组织以前是未知的。当研究人员分析这个区域时,他们发现不同的个体含有10到40个TSPY拷贝。
“当你发现以前从未见过的变异时,总是希望这些基因组变异对理解人类健康很重要,”Phillippy博士说。“医学上相关的基因组变异可以帮助我们在未来设计更好的诊断方法。”
参考文献:The complete sequence of a human Y chromosome” 23 August 2023, Nature
除了完整的Y染色体序列,NHGRI资助的人类基因组结构变异联盟报告了43种不同的人类Y染色体的序列,也发表在今天的同一期《Nature》杂志上。这些进展补充了T2T联盟于2022年发布的无空白人类基因组序列,以及NHGRI资助的人类泛基因组参考联盟于2023年5月发布的“泛基因组”。通过这些成就,科学家们已经获得了丰富的新的基因组学资源来揭示人类生物学,并为基因组医学的未来铺平了道路。