无偏锚定:可靠全基因组共线性检测的新曙光

《Algorithms for Molecular Biology》:Unbiased anchors for reliable genome-wide synteny detection

【字体: 时间:2025年04月06日 来源:Algorithms for Molecular Biology 1.5

编辑推荐:

  在比较基因组学研究中,正交同源推断是关键任务,但当前基于序列相似性和基因组注释的方法存在局限。研究人员开展了无注释共线性检测方法(AncST)的研究,发现该方法在近缘基因组中表现出色,为共线性分析提供了新选择,有助于深入研究基因组进化。

  在生物进化的长河中,物种的基因组不断演变,犹如一幅幅动态的画卷。比较基因组学旨在解读这些画卷,探寻物种间的遗传奥秘,其中正交同源推断(Orthology inference)是这一领域的基石。然而,传统依赖序列相似性的方法困难重重。一方面,基因组的快速进化,像基因重复、重排等现象频繁发生,使得即使亲缘关系很近的物种,基因组也并非完全由一对一的正交同源基因构成,人类和黑猩猩特有的 KRAB - ZNF 基因就是例证。另一方面,在亲缘关系较远的物种中,部分基因组序列差异巨大,超出了序列相似性搜索的检测范围,这对于研究快速进化的特征,如一些非编码 RNA,极为不利,还会导致基因年龄低估、分类群特异性创新高估等系统性偏差。
同时,现有共线性(Synteny)分析方法多依赖基因组注释,常用的 DAGchainer 和 MCScanX 等软件,虽然算法强大,但输入要求局限于蛋白质编码基因,使得研究范围受限。在这种背景下,莱比锡大学(Leipzig University)、霍恩海姆大学(University of Hohenheim)等机构的研究人员开启了一项重要研究,旨在开发一种无注释的共线性检测方法,为比较基因组学研究开辟新道路。最终,他们成功开发出 AncST(Anchor Synteny Tool),相关研究成果发表在《Algorithms for Molecular Biology》上,为该领域带来了新的曙光。

研究人员主要采用了以下关键技术方法:首先,基于 k - mer 统计识别锚定候选区域。通过计算 k - mer 频率,筛选出可能的锚定候选序列,如设置 k = 13、 = 500 等参数,利用 GenMap 软件进行计算。其次,使用 BLAST 工具进行序列比对,确定锚定匹配。在比较锚定候选序列时,设定特定的 E 值阈值和比对参数,以保证结果的准确性。最后,构建锚定图整合多基因组锚定,将成对锚定整合为跨多个基因组的聚类,判断共线性的一致性。

研究结果如下:

  • AncST 方法原理:该方法将基因组表示为 DNA 字符串,通过定义 - 唯一性来筛选锚定候选序列。若字符串满足,则 - 唯一的。当两个基因组中 - 唯一的 - 唯一的满足时,它们构成锚定匹配。
  • 算法实现与评估:在实现过程中,从 k - mer 计数确定锚定候选,再到计算成对锚定,最后整合多基因组锚定。测试发现,约 1/3 的传递性隐含锚定匹配缺失,14% 的锚定匹配存在与最佳匹配序列距离过大的情况,但总体上 AncST 能产生许多高可信度的匹配,误报率可接受。
  • 与注释法比较:与基于注释的共线性分析(如 MCScanX)相比,AncST 在近缘基因组中表现更好,能识别更多共线性 DNA;而注释法在进化距离大时更具优势,因其可通过氨基酸序列比对识别高度分化序列的同源性。在 16 个物种的测试中,AncST 锚定覆盖了约 86% 的黑腹果蝇注释 ORF 的基因组位置,而注释 ORF 仅覆盖约 20% 的 AncST 锚定的基因组位置。
  • 应用案例 - Hox 基因研究:以 Hox 基因簇为例,AncST 能有效追踪其在不同物种中的共线性,发现许多潜在重排,如 D. busckii 中 Ubx 的重定位,以及 D. melanogaster 和 D. yakuba 之间 Hox 基因簇顺序的可能变化。

研究结论和讨论部分表明,AncST 作为一种新方法,直接对未注释的基因组 DNA 序列进行操作,克服了传统注释依赖方法的部分局限性,在近缘基因组研究中优势明显。不过,该方法也存在一些待解决的问题,如 k - mer 统计可能遗漏锚定候选,当前锚定候选可能包含重复短序列导致错误匹配等。未来研究可进一步优化锚定候选选择,扩展方法以处理基因组重复区域,并利用共线性锚定匹配改进多基因组比对,为比较基因组学研究提供更有力的工具,推动生物进化和基因组学领域的深入发展。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号