基于图形泛基因组解析甘蓝型油菜结构变异对基因表达的影响及意义

《Theoretical and Applied Genetics》:Graphical pangenomics-enabled characterization of structural variant impact on gene expression in Brassica napus

【字体: 时间:2025年04月04日 来源:Theoretical and Applied Genetics 4.4

编辑推荐:

  为探究结构变异(SVs)对基因表达调控的影响以及泛基因组图在表达数量性状位点(eQTL)分析中的效用,研究人员结合甘蓝型油菜的长读长和短读长全基因组测序数据与表达谱进行研究。结果发现 SVs 对基因表达多样性有贡献,该研究为作物 eQTL 分析提供了新视角。

  在生命科学的广袤领域中,作物遗传研究一直是备受瞩目的焦点。甘蓝型油菜作为重要的经济作物,其产量、品质等性状受到多种遗传因素的调控。其中,结构变异(Structural Variations,SVs)在作物基因组中广泛存在,对作物的生长发育、产量以及应对环境变化的能力有着至关重要的影响。然而,以往对 SVs 的研究面临诸多挑战。传统的单参考基因组在分析 SVs 时存在局限性,无法全面捕捉物种的遗传多样性,导致许多与 SVs 相关的重要信息被遗漏。同时,在基因表达调控研究中,由于参考序列偏差等问题,对基因表达的准确量化也困难重重。这些问题严重阻碍了我们对作物遗传机制的深入理解,也限制了作物遗传改良的进程。
为了突破这些困境,来自德国吉森大学(Justus Liebig University)等机构的研究人员开展了一项极具意义的研究。他们旨在评估 SVs 对甘蓝型油菜基因表达调控的影响,并探索泛基因组图(Pangenome graphs)在 eQTL 分析中的应用价值。该研究成果发表在《Theoretical and Applied Genetics》上,为作物遗传研究领域带来了新的曙光。

研究人员运用了多种关键技术方法。首先,他们选取了 100 个遗传多样的甘蓝型油菜精英自交系,其中 57 个用于长读长测序,100 个用于短读长测序。在样本处理上,精心培养植株并采集叶片样本,分别提取 DNA 和 RNA。接着,利用牛津纳米孔(Oxford Nanopore,ONT)长读长测序技术和 Illumina 短读长测序技术对基因组进行测序。通过 cuteSV 等软件进行 SVs 检测,使用 Paragraph、Giraffe/vg 和 EVG 等工具进行基于图的 SV 基因分型。在基因表达定量方面,构建泛基因组图并利用 rpvg 进行转录本表达定量,同时使用 Kallisto 作为对照。最后通过 matrixEQTL 进行 eQTL 分析。

研究结果如下:

  1. 广泛的结构变异:通过 ONT 长读长测序数据,在 57 个德国甘蓝型油菜品系中发现了 94824 个结构变异,包括 48396 个插入(Insertions,INS)和 46428 个缺失(Deletions,DEL)。这些变异导致了 164 Mb 的 SV 空间,其中 83 Mb 的插入在单参考基因组中未被代表。SVs 在基因组中的分布显示,12.80% 位于基因内,21.22% 在基因 1 kb 范围内,65.98% 在基因间区域1
  2. 基于图的 SV 基因分型:测试了三种基于图的 SV 基因分型方法,发现 Paragraph 在平衡参考和替代等位基因的插入基因分型方面表现更优。正确分型的 SVs 比错误分型的更长,错误分型的 SVs 平均拷贝数更高,且与初始 SV 检测时的更高误差相关。此外,研究表明基因分型错误不太可能对关联研究产生实质性影响234
  3. 基因组变异对转录本表达定量的影响:比较基于线性参考(Kallisto)和基于泛基因组图(rpvg)的转录本丰度估计方法,发现基因组变异对表达定量有显著影响。转录本中变异的富集与两种方法间的低测量一致性相关,使用泛基因组图参考可改善定量,因此后续分析选择基于 rpvg 的表达数据567
  4. 基因近端结构变异与基因表达调控相关:最终的基于图的 eQTL 分析使用了来自 100 个纯合自交系的 SNP、SV 基因分型和基因表达数据。确定了 267 个 SV - eQTL 和 5668 个 SNP - eQTL,SVs 在 eQTL 变异中的比例高于其在所有变异中的比例。35.1% 的 SV - eQTL 转录本与任何 SNP 均无显著关联,表明这些 eQTL - SVs 与 SNP 的连锁不平衡程度不足以在仅基于 SNP 的分析中被检测到8
  5. 大多数顺式 eQTL - SVs 与转座子相似:研究发现 71% 的 eQTL - SVs 与 DNA 转座子相似,其中 Helitron 是最常见的转座子家族。转座子插入对基因表达的负面影响大于缺失,且 SVs 与较高效应大小相关的在群体中频率较低91011
  6. 受 eQTL - SVs 影响的基因实例:在鉴定出的 259 个 SV - eQTL 转录本中,92% 在拟南芥基因组中有同源物。基因本体富集分析虽未显示特定过程或功能的过度表达,但部分转录本与重要性状相关,如应激反应和形态发生12

研究结论和讨论部分指出,该研究利用泛基因组图方法发现了与甘蓝型油菜幼叶基因表达差异相关的 SNP 和 SVs。尽管由于甘蓝型油菜的异源四倍体基因组,SV 基因分型和图构建面临挑战,但研究仍取得了重要成果。研究表明 SVs 对基因表达调控有重要贡献,且许多潜在功能重要的 SVs 与 SNP 不存在连锁不平衡,这些 SVs 影响了与重要性状相关的基因表达,而这些在经典的基于 SNP 的分析中未被考虑。此外,研究还发现大多数 eQTL - SVs 序列与转座子相似,尤其是 Helitron,其在基因表达调控中发挥着重要作用。

总的来说,这项研究为作物遗传研究提供了新的思路和方法,揭示了 SVs 在甘蓝型油菜基因表达调控中的重要作用,凸显了泛基因组图在 eQTL 分析中的优势。这不仅有助于我们更深入地理解作物遗传机制,也为作物遗传改良提供了重要的理论依据和实践指导,有望推动未来作物育种技术的发展,培育出更优质、高产、适应环境变化的作物品种。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号