
-
生物通官微
陪你抓住生命科技
跳动的脉搏
中国六种杠柳属植物叶绿体基因组比较与系统发育分析揭示药用小属的种间差异
【字体: 大 中 小 】 时间:2025年09月23日 来源:Frontiers in Plant Science 4.8
编辑推荐:
本研究通过对中国六种杠柳属(Periploca)植物叶绿体全基因组(cp genomes)进行测序和比较分析,揭示了该属植物在基因组结构、重复序列和核苷酸多样性方面的特征,鉴定出10个高变区(如trnK-UUU-rps16、ycf1-ndhF等)作为潜在分子标记,并通过系统发育分析(ML/BI方法)明确了种间亲缘关系,为这类具有重要药用价值但形态鉴别困难的植物提供了可靠的分子鉴定依据和分类学解决方案。
引言
杠柳属(Periploca L.)作为夹竹桃科(Apocynaceae)的重要成员,全球约17种,具有显著的药用价值。然而,由于营养器官形态高度相似,且标本和活体植株常缺少花和果实,导致物种鉴定困难,严重制约其药用开发。传统分类学存在争议:早期研究仅承认中国有2种,而《中国植物志》记录4种,《Flora of China》增至5种,最新研究提出7种,但主要数据库仅接受6种(包括P. forrestii、P. calophylla、P. floribunda、P. sepium、P. chrysantha和P. tsiangii),其中P. omeiensis因模式标本遗失和野外未再发现而存疑。这种分类混乱凸显了利用分子工具厘清物种界限的迫切性。
叶绿体基因组(cp genomes)因其母系遗传、序列保守和突变率适中的特点,已成为物种鉴定和系统发育研究的强大工具。尤其在二代测序(NGS)技术推动下,完整cp基因组作为“超级条形码”在药用植物如黄精、蒿属和兰科中成功应用,为杠柳属的分类难题提供了新思路。当前研究多集中于该属化学成分和药理活性(如强心、抗炎、抗癌等),而cp基因组和系统发育研究仍较缺乏。
材料与方法
研究团队于花期采集了5种杠柳属植物的新鲜叶片(P. chrysantha、P. forrestii、P. calophylla、P. floribunda和P. tsiangii),凭证标本存于贵州中医药大学标本馆。为比较形态特征,对6种90个个体(每种15个)的19个形态性状(包括9个定性如叶序、叶质,10个定量如叶长、叶宽)进行主成分分析(PCA)和聚类分析。性状数据经标准化和Z-score归一化,使用R语言和SPSS软件处理。
DNA提取采用改良CTAB法,经HiSeq X-Ten平台进行150 bp双端测序。原始数据经Fastp质控后,以P. sepium(MH752592)为参考,使用NOVOPlasty进行从头组装。基因注释采用GeSeq和CPGAVAS2,tRNA预测通过tRNAscan-SE完成并经Geneious手动校正,最终通过OGDRAW可视化环状图谱。
重复序列分析使用REPuter检测长重复(正向F、反向R、互补C、回文P),参数设置:最小重复20 bp,最大60 bp,汉明距离3。简单序列重复(SSR)通过MISA检测,单、二、三、四、五、六核苷酸最小重复数分别设为10、6、4、3、3、3。
序列分歧和核苷酸多样性分析中,使用CPJSdraw比较IR边界,mVISTA(Shuffle-LAGAN模式)以P. forrestii为参考进行基因组比对,DnaSP计算Pi值(窗口长800 bp,步长200 bp)。为验证分子标记,针对高变区设计16对引物,PCR扩增后经1%琼脂糖凝胶电泳和Sanger测序验证。
系统发育分析包含28个夹竹桃科物种(含6种中国杠柳)的完整cp基因组,以Halenia elliptica为外群。序列经MAFFT比对后,使用IQ-TREE(最佳模型TVM+F+I+R4)进行最大似然法(ML)分析,自举值(bootstrap)1000次;MrBayes(GTR+F+I+G4模型)进行贝叶斯推断(BI),运行200万代,前25%作burn-in。最终树形通过iTOL可视化。
结果
基于形态特征的主成分分析和聚类分析
PCA结果显示前两个主成分(Dim1和Dim2)累计方差贡献率达92.0%,其中Dim1(66.6%)与13个形态性状显著相关(包括叶序LA、叶形LS、叶宽LW、叶长LL、叶质LT、叶脉LV以及花部特征如花冠形态CF、副花冠毛被PS、花冠宽CW、萼径CD、萼腺CG、副花冠长PL、雄蕊长SL),Dim2(25.4%)主要与5个花部性状相关(花冠长CL、花径FD、花冠长宽比CR、花冠形CS、花药形AS)。在PCA排序空间中,P. sepium和P. chrysantha沿Dim1明显聚拢,P. forrestii、P. calophylla和P. floribunda分布重叠,而P. tsiangii因花冠裂片线状披针形且显著伸长而独居一区。强关联Dim1的性状(如叶序、花冠形态、叶质、叶脉、副花冠毛被、萼径和萼腺数)被提议作为杠柳属的关键分类标准。
聚类分析在欧氏距离20处将6种分为两簇:第一簇含P. sepium和P. chrysantha,特征为交互对生叶序、叶大膜质、叶脉20–25条较疏、每萼片基具2腺体、花冠裂片棍棒状增厚且反折、副花冠无毛;第二簇含P. calophylla、P. floribunda、P. forrestii和P. tsiangii,特征为二列叶序、叶革质或近革质、叶脉密度>25条、萼径较小且每萼片基具1腺体、花冠裂片均匀不增厚不反折、副花冠密被毛。欧氏距离降至10时,物种进一步分为三簇:第一簇仍为P. sepium和P. chrysantha;第二簇含P. calophylla、P. floribunda和P. forrestii;第三簇仅P. tsiangii。
叶绿体基因组的一般特征
6种杠柳cp基因组均呈典型环状四分体结构,总长153,513(P. sepium)至154,140 bp(P. forrestii),包括LSC(83,818–84,941 bp)、SSC(17,619–18,084 bp)和两个IR(25,790–25,809 bp)。总GC含量稳定(38.10–38.19%),但区域分布不均:IR区最高(43.41–43.45%),LSC(36.23–36.35%)和SSC(31.92–32.15%)较低。基因组共编码132个基因,含87个蛋白编码基因、37个tRNA基因和8个rRNA基因。其中16个基因含1个内含子(如atpF、ndhA、ndhB等),2个基因(ycf3和clpP1)含2个内含子。rps12基因发生反式剪接,5'端位于LSC,3'端在IR区。
重复序列和SSR分析
共检测到60个长重复序列,其中P. forrestii、P. calophylla、P. floribunda和P. tsiangii含所有4类型(F、P、C、R),P. sepium和P. chrysantha仅含F、P、R。正向重复(23–26个)和回文重复(25–31个)最丰富,长度主要集中在21–40 bp。
SSR总数55–73个,共5类型(单、二、三、四、五核苷酸重复),缺六核苷酸。P. tsiangii和P. floribunda最少(5个),P. chrysantha最多(10个)。所有种均含单、二、三、四核苷酸SSR;P. sepium和P. chrysantha缺五核苷酸。单核苷酸重复(A/T)最优势,占总数66.67–84.51%。除P. forrestii和P. calophylla外,其余4种含C/G单核苷酸SSR。AAAG/CTTT四核苷酸重复为P. forrestii独有。
IR区的扩张与收缩及核苷酸多样性
IR边界比较显示,6种杠柳IR区长25,790–25,809 bp,近缘种Pentalinon luteum为25,766 bp。JLB(LSC/IRb)边界均位于rps19基因,IRb区跨度74或75 bp,变异极小。JSA(IRa/SSC)和JSB(SSC/IRb)边界均位于ycf1基因:P. sepium和P. chrysantha的ycf1向IRa和IRb延伸1088 bp;P. forrestii、P. calophylla、P. floribunda和P. tsiangii延伸1075 bp;P. luteum为1070 bp。所有cp基因组中,ndhF和trnH基因分别专位于SSC和LSC,而rpl2基因始终位于IR区。
mVISTA比较显示编码区高度保守,非编码区变异较高,突变热点集中于基因间隔区(IGS)。14个高变区中12个位于IGS,如trnK-UUU-rps16、rps16-trnQ-UUG-psbK等。核苷多样性(Pi)分析表明IR区多样性最低,SSC最高。共鉴定10个高变区(Pi > 0.017),主要位于LSC和SSC:SSC区ndhF-rpl32、ycf1-ndhF和rps15-trnN-GUU的IGS及ndhA基因Pi值超0.017;LSC区rps16-trnQ-UUG-psbK的IGS多样性最高(Pi=0.02515),trnK-UUU-rps16、rpoB-trnC-GCA-petN、ycf3-trnS-GGA-rps4、trnT-UGU-trnL-UAA和ndhC-trnC-ACA的IGSPi值亦超0.017。
基于叶绿体基因组分析的潜在分子标记验证
针对高变区设计16对特异性引物,经PCR和Sanger测序验证,结果与NGS数据高度一致。以ndhC-trnC-ACA区为例,引物对10在所有5种中均扩增出目标条带,其中P. chrysantha通过PCR即可区分。比较显示该区存在3个区间(P1、P2、P3)的indel:P. chrysantha在此区有381 bp缺失,可作为诊断标记;P1区P. chrysantha有4个特异点突变,P. calophylla在35位点为A;P2区除P. floribunda外均存在1–3 bp缺失(近400位),近520位的种特异性indel可区分其余4种;P3区P. chrysantha有9 bp缺失,P. forrestii缺6 bp,另3种无缺失,且P. tsiangii在596位点(碱基A)可区分。这些变异区有效区分了5种杠柳,表明其作为属内物种鉴定分子标记的潜力。
系统发育分析
以Halenia elliptica为外群,基于28个夹竹桃科物种完整cp基因组的ML和BI分析得到高度一致且支持率强(ML bootstrap=100%,BI PP=1.0)的系统树。28种(除外群)分为12大支。在杠柳族(Periploceae)支中,6种杠柳与Myriopteron extensum构成强支持单系群,符合传统分类。6种杠柳形成独立亚支(100%支持),表明其与杠柳族其他属 phylogenetically distinct。中国6种分为两支:一支含P. sepium和P. chrysantha,另一支含P. forrestii、P. calophylla、P. floribunda和P. tsiangii。该划分与形态聚类结果一致,也符合《中国植物志》和《Flora of China》记载:P. sepium以膜质叶区分,P. chrysantha作为新种(Yao et al., 2002)在形态上兼具膜质叶和类似P. sepium的花部特征,与系统发育结果相符。
讨论
分子划界的必要性
形态PCA中前两主成分解释92.0%方差,Dim1(66.6%)与叶和花性状均显著相关,强调花部形态对准确物种鉴定的重要性,也印证了传统分类学挑战和补充分子标记的必要性。比较完整cp基因组有效增强了许多植物群的物种分辨率,使得全面检查杠柳属cp基因组变异成为研究优先。
叶绿体基因组的结构保守与分歧
6种杠柳cp基因组在大小、结构、基因内容和GC含量上高度保守,最大长度差仅627 bp。总GC含量稳定(38.10–38.19%),但区域分布不均,IR区因含4个rRNA基因(rrn4.5、rrn5、rrn16、rrn23)而较高。GC含量不均及rps12反式剪接在其他植物中也有报道。
长重复序列(≥30 bp)在被子植物中普遍存在,对基因组稳定和结构变异起重要作用。6种共鉴定60个长重复,回文(P)和正向(F)重复最常见。不同种间重复单元数量和类型略有变化。SSR作为群体遗传关系和系统学研究的有价值分子标记,在6种cp基因组中数量55–73个,其中单核苷酸A/T重复主导(66.67–84.51%),符合被子植物cp基因组的AT偏好性。这些重复元件和SSR,尤其是LSC区更可变者,可作为该属系统发育、群体遗传研究和药材鉴定的宝贵潜在分子标记。
IR区收缩扩张在塑造cp基因组结构中起关键作用,通过基因复制、缺失或假基因化影响基因内容、长度和组织。IR边界移位比较揭示了6种杠柳间的动态扩张/收缩事件,尤其影响ycf1基因。这种结构变异,特别是ycf1-ndhF基因间隔区,凸显其作为区分近缘杠柳种DNA条形码的潜力。
高变区作为潜在分子标记
分歧区可作为有效分子标记,为DNA条形码和系统学研究提供宝贵信息,并促进筛选分歧热点用于系统重建。比较基因组学(mVISTA)和核苷多样性(Pi)计算证实非编码区(尤其IGS)比编码区可变性更高。鉴定出的10个高变区(Pi>0.017)主要位于LSC和SSC,是开发特异性DNA条形码的有望靶点。该推断通过设计靶向这些区的引物并进行Sanger测序得到实验验证:测序结果与NGS数据高度一致,这些高变区内的种特异性indel和SNP有效区分了所有5种测序杠柳,证实其作为杠柳属分子标记的效用。
系统发育关系与分类学意义
系统发育分析对阐明种间关系和植物资源保护、合理开发利用起关键作用。cp基因组因能解决形态分类学无法解决的问题而被广泛用于较低分类水平的系统关系探索。传统分类中,杠柳亚科(Periplocoideae)以四合花粉和离生花丝为特征区分其他亚科;杠柳族(Periploceae)以副花冠和花丝同时着生花冠基部并与花丝合生区分其他族;杠柳属以异形副花冠裂片为关键特征而易与其他属区分。
本研究基于完整cp基因组的ML和BI分析得到了一致且高支持的系统树。6种杠柳与Myriopteron extensum在杠柳族内构成一支,与传统分类一致。杠柳属内分为两大支:一支含P. sepium和P. chrysantha,另一支含另4种。该系统结构与本研究揭示的形态聚类模式高度一致。P. sepium和P. chrysantha的密切关系得到共享形态特征(如交互对生叶序、膜质叶、花冠裂片增厚反折)的支持。因此,系统重建为这些种的分类处理和未来利用提供了稳健框架。
结论
高通量DNA测序技术和生物信息学的快速发展显著增强了人们对cp基因组在药用植物物种鉴定和系统研究中的兴趣,因其丰富的遗传信息和显著保守性。本研究首次对中国5种杠柳cp基因组进行测序、组装和注释,结合NCBI已发表的P. sepium,全面分析了该属cp基因组序列、结构和特征,筛选出用于该属鉴定的差异序列,并探讨了中国杠柳种间及属内、属间的系统发育关系。结果表明杠柳cp基因组能有效解决属内物种水平鉴定和系统问题。本研究补充了传统依赖叶形态鉴定缺少花果实标本的不足,促进了该属植物的准确药用应用。
生物通微信公众号
知名企业招聘