-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature Genetics:多种技术解析草莓基因组
【字体: 大 中 小 】 时间:2019年02月27日 来源:生物通
编辑推荐:
近日,美国密歇根州立大学和加州大学戴维斯分校的研究人员组装出近乎完整的栽培草莓基因组,并揭示了这种复杂的异源多倍体的起源和进化过程。
一转眼又到了草莓上市的季节。这种小巧可爱的果实有着酸甜可口的味道,可搭配出各种各样的美妙滋味。不过,对于草莓的基因组,你又了解多少?
世界各地广泛种植的凤梨草莓(Fragaria × ananassa)是一种有着八倍体基因组的复杂植物,由两种野生的八倍体草莓杂交而成:弗吉尼亚草莓(Fragaria virginiana)和智利草莓(Fragaria chiloensis)。这两种植物都来自四个二倍体祖先物种。
近日,美国密歇根州立大学和加州大学戴维斯分校的研究人员组装出近乎完整的栽培草莓基因组,并揭示了这种复杂的异源多倍体的起源和进化过程。这项成果发表在《Nature Genetics》杂志上。
在这项研究中,研究人员利用了Illumina短读长、PacBio长读长以及10x Genomics单倍型定相数据的组合,并在Dovetail Hi-C染色体相互作用数据的帮助下进行组装。由此产生的从头组装包含近108,100个预测的蛋白编码基因,有助于人们了解草莓的系统发育和二倍体祖先植物。
“这个参考基因组可作为一种强大的平台,供育种人员开发同源特异性的标记,以便追踪和利用目标基因座上的等位基因多样性,”作者总结道,并指出“我们预计,该参考基因组将大大加速栽培种凤梨草莓的分子育种工作”。
研究人员从幼嫩的凤梨草莓叶组织中提取出高分子量DNA,并制备文库用于PacBio RSII和Illumina多个平台上的测序。他们还获得了10x Genomics Chromium和Dovetail Hi-C数据,综合后生成805.5 Mb的基因组组装,预计占草莓基因组的99%。
然后,他们利用现有的软件、蛋白序列数据、表达序列标签和10套转录组数据来注释基因组,发现凤梨草莓基因组中大约含有108,087个蛋白编码基因和15,621个明显的基因间长链非编码RNA(lncRNA)。
研究人员还对数十种二倍体草莓的转录组进行了测序,以协助后续的系统发育研究。利用系统发育和基因转换分析,他们探索了草莓中抗病基因的来源,特别关注核苷酸结合位点和富含亮氨酸重复序列(NBS-LRR)基因簇。
此外,研究人员指出,超过三分之一的草莓基因组组装都由转座元件(TE)序列组成,特别是长末端重复反转录转座子(LTR-RT)。他们的结果表明,随着TE密度的降低,基因表达上升,反之亦然,这表明TE密度在异源多倍体植物各个亚基因组间的平衡中起作用。
例如,他们发现来源于野草莓(F. vesca)祖先植物亚基因组的基因表达增加,其TE密度低于二倍体祖先日本草莓(F. nipponica)、绿色草莓(F. viridis)以及饭沼草莓(F. iinumae)。这似乎促进了显性亚基因组所编码的代谢通路,包括那些与草莓颜色、味道和香气有关的代谢通路。
“通路分析表明,某些代谢组和抗病性状在很大程度上受到显性亚基因组的控制,”作者写道,并指出“这些结果和参考基因组应当成为未来进化研究的有力平台,协助实现草莓的分子育种”。(生物通 薄荷)
原文检索
Origin and evolution of the octoploid strawberry genome