研究人员主要采用了以下关键技术方法:首先,基于 k - mer 统计识别锚定候选区域。通过计算 k - mer 频率,筛选出可能的锚定候选序列,如设置 k = 13、? = 500 等参数,利用 GenMap 软件进行计算。其次,使用 BLAST 工具进行序列比对,确定锚定匹配。在比较锚定候选序列时,设定特定的 E 值阈值和比对参数,以保证结果的准确性。最后,构建锚定图整合多基因组锚定,将成对锚定整合为跨多个基因组的聚类,判断共线性的一致性。
应用案例 - Hox 基因研究:以 Hox 基因簇为例,AncST 能有效追踪其在不同物种中的共线性,发现许多潜在重排,如 D. busckii 中 Ubx 的重定位,以及 D. melanogaster 和 D. yakuba 之间 Hox 基因簇顺序的可能变化。
研究结论和讨论部分表明,AncST 作为一种新方法,直接对未注释的基因组 DNA 序列进行操作,克服了传统注释依赖方法的部分局限性,在近缘基因组研究中优势明显。不过,该方法也存在一些待解决的问题,如 k - mer 统计可能遗漏锚定候选,当前锚定候选可能包含重复短序列导致错误匹配等。未来研究可进一步优化锚定候选选择,扩展方法以处理基因组重复区域,并利用共线性锚定匹配改进多基因组比对,为比较基因组学研究提供更有力的工具,推动生物进化和基因组学领域的深入发展。