芒果‘桂七’与四瓣芒果叶绿体基因组解析及系统发育研究揭示杂交渐渗现象
【字体:
大
中
小
】
时间:2025年10月01日
来源:Molecular & Cellular Oncology 1.9
编辑推荐:
本研究首次报道了芒果栽培品种‘桂七’(Mangifera indica ‘Guiqi’)与野生种四瓣芒果(M. quadrifida)的完整叶绿体基因组(cpDNA),通过高通量测序和生物信息学分析完成组装与注释。两种cpDNA均呈现典型的四分体结构,长度分别为157,780 bp和158,979 bp,各含132个基因(87个蛋白编码基因、37个tRNA、8个rRNA),GC含量相近(37.9% vs 37.8%)。系统发育分析证实‘桂七’的母系遗传起源,并揭示四瓣芒果与M. similis的亲缘关系最近,为芒果属广泛存在的杂交与基因渐渗提供了关键分子证据。
尽管芒果是具有重要经济价值的水果,但芒果属叶绿体基因组序列的可用性仍然有限。本研究组装、注释并表征了芒果‘桂七’和四瓣芒果的完整叶绿体基因组。芒果‘桂七’(157,780 bp)和四瓣芒果(158,979 bp)的叶绿体基因组均呈现四分体结构,包含87个蛋白质编码基因、37个tRNA基因和8个rRNA基因,GC含量分别为37.9%和37.8%。系统发育分析证实了芒果‘桂七’的母系起源,并揭示了四瓣芒果与M. similis的最密切亲缘关系,表明存在广泛的杂交和基因渐渗。
芒果属(Mangifera L.)属于漆树科(Anacardiaceae),包含约68个物种,广泛分布于热带亚洲。它们主要分布在马来西亚,向西延伸至印度和斯里兰卡,向东至菲律宾,向北经印度至中国,向南至印度尼西亚。芒果(Mangifera indica L. 1753)是一种著名且广受欢迎的热带水果,因其高营养价值、美味口感和独特香气而备受赞誉,而四瓣芒果(M. quadrifida Jack 1824)是一种稀有物种,能在营养贫瘠的土壤和排水不良等极端条件下生长良好。这两种植物都具有很高的药用价值,含有抗氧化剂、抗炎剂、抗糖尿病特性以及具有潜在抗癌活性的活性化合物。
目前,多种芒果品种在热带和亚热带地区广泛栽培。收集这些宝贵水果作物的基因组信息将有利于分子育种、遗传保护和进化研究。尽管芒果是重要的经济作物,但截至2024年11月15日,NCBI GenBank数据库中目前仅公开了26条芒果属叶绿体基因组记录。本研究调查了两个不同的材料:商业栽培品种芒果‘桂七’和四瓣芒果的野生材料。芒果‘桂七’表现出强烈的芳香特性和极低的果肉纤维含量,而四瓣芒果则表现出独特的李子样挥发性成分和纤维状的白色可食用果肉。我们的目标是:(1)组装和注释它们的完整叶绿体基因组;(2)表征它们的结构特征;(3)利用叶绿体基因组序列重建芒果属的系统发育关系。
从广西亚热带作物研究所种质资源圃(北纬22°53′55″,东经108°20′33″)的成年芒果‘桂七’植株和INTI国际大学中药园(北纬2°48′41″,东经101°45′29″)的迁地保护四瓣芒果材料中采集新鲜成熟叶片。叶片立即用硅胶保存。芒果‘桂七’和四瓣芒果的凭证标本分别保存在中山大学标本馆(Prof. Dr. Wenbo Liao)和INTI国际大学健康与生命科学学院生物技术实验室(Prof. Dr. Lee Shiou Yih),凭证号分别为K.K. Meng 20240902和LSY16。
基因组DNA的提取遵循Meng等人(2021)的方法。使用NanoDrop分光光度计和Qubit荧光计分别评估DNA的质量和数量。随后构建DNA文库,并在华大基因(BGI Genomics Co., Ltd.)使用DNBSEQ-T7平台进行双末端(2×150 bp)高通量测序。使用fastp v. 0.23.1处理原始数据以生成清洁数据,参数设置为-q 20 -u 10,并使用FastQC v0.11.9进行质量控制。使用GetOrganelle v1.7.7.0以芒果的rbcL基因(ON805861.1)作为初始种子序列,并辅以embplant_pt参考数据库来组装叶绿体基因组。为确保基因注释的完整性和准确性,我们手动比较了GeSeq v2.03和CPGAVAS2两种工具对每个基因组特征的结果。使用在线软件CPGView可视化转录本的详细结构并识别难以注释的基因。使用BWA-MEM v0.7.17将处理后的双末端读数与参考叶绿体基因组进行比对,参数默认。将SAM文件转换为BAM格式,然后使用SAMtools v1.10去除PCR重复。使用deeptools v. 3.5.1中的bamCoverage模块将BAM文件转换为BigWig文件,以便在Integrative Genomics Viewer (IGV) v2.11.2中可视化。
系统发育分析基于GenBank中26个芒果属物种的完整叶绿体基因组序列。将近缘物种Bouea macrophylla作为外类群。使用MAFFT v7(–auto参数)比对叶绿体基因组序列,然后使用TrimAl v1.4根据默认阈值应用‘gappyout’模型进行修剪。使用ModelFinder计算最佳核苷酸替代模型。根据贝叶斯信息准则(BIC),最佳核苷酸替代模型是广义时间可逆模型(GTR),具有基于经验的频率(+F)和不变位点(+I)(=GTR+F+I)。使用IQ-TREE v2.1构建最大似然(ML)树,设置10,000次Shimodaira-Hasegawa近似似然比检验(SH-aLRT)重复和5,000次UltraFast自举(UFboot)重复。
测序为芒果‘桂七’产生了100,083,838条原始读数(15.01 Gb)和98,687,824条高质量清洁读数(14.80 Gb)。对于四瓣芒果,我们获得了86,695,480条原始读数(13.00 Gb)和85,699,904条清洁读数(12.85 Gb)。基于芒果‘Alphonso’的参考基因组,两个材料的平均测序覆盖深度达到约38×。芒果‘桂七’和四瓣芒果的比对深度分别为7,916至16,825和3,073至6,737,组装出的叶绿体基因组序列显示为四分体结构。芒果‘桂七’和四瓣芒果的总基因组序列长度、基因数量和GC含量分别为157,780 bp和158,979 bp、132和132、37.9%和37.8%。叶绿体基因组由一个大单拷贝区(LSC,86,673 bp和87,764 bp)、两个反向重复区(IRs,26,379 bp和26,396 bp)和一个小单拷贝区(SSC,18,349 bp和18,423 bp)组成。芒果‘桂七’和四瓣芒果的叶绿体基因组均包含87个蛋白质编码基因、37个tRNA基因和8个rRNA基因。两个物种中有17个基因是重复的,包括4个rRNA基因、7个tRNA基因(trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG和trnV-GAC)和6个蛋白质编码基因(ndhB、rpl2、rpl23、rps7、ycf2和ycf15)。九个基因,包括atpF、ndhA、ndhB、petB、petD、rpl2、rpl16、rpoC1和rps16,包含一个内含子,而clpP、ycf3和反式剪接基因rps12则拥有两个内含子。
最终修剪后的比对长度为157,149 bp,识别出778个简约信息位点。基于完整叶绿体基因组序列的系统发育分析揭示了物种水平上部分解析的关系。然而,种内水平(即芒果)的关系未得到支持。芒果‘桂七’与其他六个芒果材料聚为一支(SH-aLRT = 77, UFboot = 81)。本研究中使用的四瓣芒果的系统发育关系完全解析为与四瓣芒果同属一个分支的成员,并且与M. similis亲缘关系最近。
Discussion and conclusions
本研究首次报道、注释和表征了来自马来西亚的芒果‘桂七’和四瓣芒果的叶绿体基因组。与其它芒果属物种相比,这两种叶绿体基因组在基因组结构、GC含量、基因组成方面高度保守。对于芒果‘桂七’,蛋白质编码基因数量的变异可归因于ycf15重复基因和infA基因的缺失。基于ML树,某些芒果属物种的系统发育聚类与地理分布的相关性比与分类学分类的相关性更强。鉴于芒果属中观察到的高杂合度和频繁的异花授粉,此类事件可能归因于种内或种间广泛存在的基因渐渗和杂交。尽管如此,此处组装的叶绿体基因组将为未来的芒果育种计划和种质开发提供宝贵资源。这些发现强调了未来需要进行种群水平的研究,以阐明这一重要经济属的杂交动态和进化机制。
根据IUCN濒危物种红色名录(访问于2024年11月18日),芒果‘桂七’和四瓣芒果这两个分类群未被列为受保护物种。因此,从这些植物中采集样品不需要任何许可或批准。
Author contribution statement
CRediT: Kaikai Meng: 概念化,形式分析,调查,项目管理,资源,软件,验证,撰写初稿;Yuming Qin: 调查,资源,软件,验证,撰写初稿;Junru Qu: 调查,资源,软件,验证,撰写初稿;Shiou Yih Lee: 概念化,项目管理,资源,监督,审阅编辑;Liyan Lu: 调查,资源,软件,验证,撰写初稿;Peishan Zou: 资源,软件,验证,审阅编辑;Guodi Huang: 概念化,项目管理,审阅编辑。
KKM, SYL, GDH: 构思与设计;KKM, YMQ, JRQ, LYL, PSZ: 样品收集、数据分析与解释;KKM, YMQ, JRQ, LYL: 论文起草;SYL, PSZ, GDH: 论文批判性修订;所有作者批准最终版本;所有作者同意对工作的所有方面负责。
Data availability statement
支持本研究结果的基因组序列数据可在NCBI的GenBank中公开获取,登录号为PQ568955和PQ568954。相关的BioProject、SRA和BioSample编号分别为PRJNA1176453、SRR31094034和SRR31094035,以及SAMN44399365和SAMN44399366。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号