草莓品种‘月心’单倍型解析染色体水平基因组组装揭示果实品质改良的遗传基础

【字体: 时间:2025年06月11日 来源:Scientific Data 5.8

编辑推荐:

  本研究针对草莓果实品质遗传基础不明的问题,通过PacBio HiFi和Hi-C测序技术完成了栽培草莓品种‘月心’(Fragaria × ananassa cv. Yuexin)的单倍型解析染色体水平基因组组装(875.84 Mb,N50 27.6 Mb),鉴定出26,485个与‘卡玛罗莎’品种的结构变异(SV),定位到细胞壁代谢、苹果酸代谢和香气合成相关基因的启动子或编码区。该成果为草莓分子设计育种提供了重要资源,发表于《Scientific Data》。

  

草莓基因组研究的突破与挑战
草莓作为全球重要的经济水果,其复杂的八倍体基因组(2n=8x=56)一直是遗传研究的难点。尽管2019年首个染色体水平的‘卡玛罗莎’品种基因组发布,但单倍型分辨率不足限制了等位基因变异的精准解析。中国主栽品种‘月心’因其独特的果实软度和香气特征成为研究焦点,但其遗传改良机制尚未阐明。

浙江大学联合江苏省农业科学院的研究团队在《Scientific Data》发表了‘月心’草莓的高质量基因组。通过整合PacBio HiFi长读长(85X覆盖度)、Hi-C(111X)和Illumina短读长数据,构建了包含两个单倍型(867.93 Mb和823.17 Mb)的染色体水平组装,并利用SubPhaser成功将八倍体基因组划分为四个亚基因组。比较基因组分析发现,与亲本‘卡玛罗莎’相比,‘月心’存在26,485个结构变异(SV),其中70%位于基因间区,29.9%影响11,414个编码基因,包括23个与果实质地、有机酸和香气相关的关键基因。

关键技术方法
研究采用CTAB法提取叶片DNA,通过PacBio Sequel II平台生成73.25 Gb HiFi数据,结合Hi-C(95.4 Gb)和Illumina短读长(55.89 Gb)进行Hifiasm组装。利用Juicer和3D-DNA进行染色体挂载,RepeatModeler注释重复序列(51.25%为转座元件),MAKER整合RNA-Seq和同源证据预测110,776个蛋白编码基因。结构变异通过minimap2和SyRI鉴定,PCR验证了6个SV的准确性。

研究结果

  1. 基因组组装质量
    初级组装和两个单倍型的N50分别达27.6 Mb、27.3 Mb和27.6 Mb,BUSCO完整性达99.07%,LAI指数15.8,QV值47.1,显示高度连续性和准确性。

  2. 亚基因组与重复元件
    LTR逆转录转座子占基因组的22.92%,通过“差异k-mer”特征将八倍体基因组划分为四个亚基因组(Supplementary Figure S3)。

  3. 结构变异的功能影响
    启动子区的SV影响5,590个基因,如细胞壁修饰酶(PME)和苹果酸转运体(ALMT)基因。基因体内的SV可能导致‘月心’与‘卡玛罗莎’果实硬度差异(Supplementary Table S5)。

  4. 非编码RNA注释
    鉴定出8,248个ncRNA,包括1,482个rRNA和444个miRNA,为调控网络研究提供基础(Supplementary Table S4)。

结论与意义
该研究首次实现了‘月心’草莓的单倍型解析基因组,揭示了亚基因组间动态进化关系。发现的SV为解释果实软度、酸度和香气差异提供了分子标记,推动草莓从传统育种向精准分子设计转型。数据集(GCA_045269825.1)将丰富蔷薇科植物泛基因组框架,为多倍体作物遗传研究树立新范式。

(注:文中所有技术术语如Hi-C(高通量染色体构象捕获)、BUSCO(基准通用单拷贝直系同源基因评估)均在首次出现时标注英文全称,专业符号如2n=8x=56保留原文格式)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号