-
生物通官微
陪你抓住生命科技
跳动的脉搏
首次完成的Y染色体完整测序
【字体: 大 中 小 】 时间:2023年08月25日 来源:National Institute of Standards and Technology (NIST)
编辑推荐:
曾经是人类基因组最后一块缺失的拼图——Y染色体——刚刚被完整地绘制出来。科学家们使用先进的测序技术读取了Y染色体的完整DNA序列,Y染色体是基因组中通常驱动男性生殖发育的区域。结果表明,这一进步提高了染色体DNA测序的准确性,这可能有助于识别某些遗传疾病,并有可能揭示其他疾病的遗传根源。
在国家人类基因组研究所(NHGRI)的带领下,美国国家标准与技术研究院(NIST)和许多其他组织的研究人员使用先进的测序技术读取了Y染色体的完整DNA序列,Y染色体是基因组中通常驱动男性生殖发育的区域。发表在《自然》杂志上的一项研究结果表明,这一进步提高了染色体DNA测序的准确性,这可能有助于识别某些遗传疾病,并有可能揭示其他疾病的遗传根源。
DNA测序并不像从基因组的开始到结束读取遗传物质那么简单。当DNA从细胞中提取出来时,它会被切碎,而且即使是最好的测序设备一次也只能处理相对较小的DNA片段。因此,研究人员和临床医生依靠特殊的软件将测序代码片段像拼图一样按正确的顺序拼凑起来。
参考基因组是一个独立的,已经拼凑在一起的基因组,它可以作为一个向导,类似于拼图盒前面的图片。而且由于99.9%的人类遗传密码是共享的,任何人类基因组都将与参考基因组紧密匹配。
去年,来自端粒到端粒(T2T)联盟的一个团队使用新的测序技术来破解基因组中以前无法破译的区域,产生了当时最完整的参考基因组——但研究中使用的细胞并不包含最令人困惑的Y染色体。
“染色体都包含非常重复的DNA片段,但Y染色体超过一半包含非常重复的DNA片段,”该研究的合著者Justin Zook说,他是NIST“瓶中基因组”(GIAB)联盟的负责人。“如果你用拼图来类比,很多Y染色体看起来就像背景一样,所有的片段看起来都很相似。”
这一次,T2T不是从零开始的,因为GIAB已经开始了这项工作。GIAB的任务是生产可用于评估测序技术的测试基准——即特定基因的高度精确测序结果,可以作为评估特定测序方法结果的答案钥匙。NIST严格分析了几个个体的人类基因组,以创建基准。虽然GIAB还没有专门为Y染色体制定一个基准,但该联盟已经广泛研究了一个基因组,在这项新研究之前已经积累了大量的Y染色体数据集。
这些数据为这项新研究的作者提供了一个起点,他们将分析重点放在了最了解的GIAB Y染色体上。他们采用长读取测序技术,使DNA片段拼图更长,因此更容易组装。机器学习分析工具和一系列其他高级程序帮助该团队识别和组装染色体片段。经过6200多万个遗传密码字母,作者们把GIAB Y染色体从头到尾拼了出来。
研究人员将他们的完整的Y染色体序列,命名为T2T-Y,与最广泛使用的参考基因组的Y染色体部分进行比较——后者充斥着许多缺失和漏洞,发现T2T-Y极大地改善了结果。T2T-Y与该小组之前的参考基因组T2T-CHM13相结合,代表了世界上一半人口所具有的Y染色体的首个完整基因组测序结果。这一最新发现可能有助于识别和诊断与Y染色体基因有关的少数已知疾病。但更重要的是,新的参照物有可能揭示新的基因及其功能。
“生育能力和一些遗传疾病的某些方面肯定与Y染色体上的基因有关,”Zook说。“但因为到目前为止很难分析,我们甚至可能还不知道Y染色体有多重要。”Zook和他在GIAB的同事们基于T2T组装的X和Y染色体开发了一个新的基准。