-
生物通官微
陪你抓住生命科技
跳动的脉搏
PacBio:HiFi测序在揭示罕见疾病、癌症转录组学、农业基因组学复杂性中展示出不一样的力量
【字体: 大 中 小 】 时间:2024年03月11日 来源:PacBio
编辑推荐:
PacBio HiFi测序技术仍然是基因组学专业人员在发现前沿工作的首选工具,使他们能够在生物学的不同领域寻求新的探索途径。
在这一期的PacBio博客系列中,重点介绍了2024年2月的科学论文。这些有趣的出版物突出了PacBio测序在揭示罕见疾病、癌症转录组学、农业基因组学等复杂性方面的力量。
癌症转录组:全长同种异构体串联测序解决癌症转录组复杂性
在这篇论文中,美国全国儿童医院和俄亥俄州立大学的研究人员介绍了他们在鉴别小儿弥漫性中线胶质瘤与邻近非恶性组织的全长异构体表达差异方面的工作。
关键要点:
该团队使用了改良版的MAS-Seq,这是驱动PacBio Kinnex试剂盒的核心化学成分。
PacBio全长RNA测序的使用导致发现了SPARC基因的一种异构体,其表达量比邻近的非恶性组织高10000倍。
研究人员还能够使用PacBio长读段检测几种癌症特异性的新亚型,这“突出了长读段测序对复杂肿瘤转录组表征的重要性”。
与非病变组织相比,癌症表现出复杂的转录组和异常剪接,诱导异构体水平的差异表达。使用短读测序的转录组学分析在提供一种具有成本效益的方法来评估同种异构体表达方面具有实用性,尽管短读组装在准确推断全长转录本方面显示出局限性。使用Pacific Biosciences (PacBio)平台的长读RNA测序(Iso-Seq)可以通过提供全长异构体序列分辨率来克服这些限制,该方法不需要读取组装,并且代表天然表达的转录本。Iso-Seq协议的约束是由于每次仪器运行的读取输出较少,例如,这可能会影响低表达转录本的检测。为了解决这些缺陷,我们开发了一种串联工作流程,PacBio全长异构体串联测序(pb_flick - seq),旨在增加独特的测序PacBio长读的数量,从而提高独特异构体的整体检测。此外,我们预计读取深度的增加将有助于提高对中等到低水平表达异构体的检测。
结果
用已知同型复杂性的商业参照 (Spike-In RNA Variants; SIRV)测序发现,使用PB_FLIC- Seq方法每次运行的读取输出,比使用Iso-Seq方案处理相同样品增加3.4倍。我们将该方案应用于一个转化癌症病例,也证明了PB_FLIC- Seq方法在鉴别小儿弥漫性中线胶质瘤与邻近非恶性组织的全长异构体表达差异方面的有效性。数据分析显示,肿瘤样本中细胞外基质(ECM)基因的表达增加,包括分泌蛋白酸性和富含半胱氨酸(SPARC)基因的异构体,其表达量比邻近非恶性组织高11,676倍。最后,通过PB_FLIC- Seq方法,我们检测到几种癌症特异性的新亚型。
结论
这项工作描述了一种基于串联的方法,用于增加PacBio平台上测序的全长同种异构体reads的数量,从而改进了表达同种异构体的发现。我们应用这一工作流程来分析小儿弥漫性中线胶质瘤和邻近非恶性组织的转录组。我们癌症特异性新亚型表达的发现进一步强调了长读测序对复杂肿瘤转录组表征的重要性。
罕见病:一种长链非编码RNA CHASERR的从头缺失引起的新型综合征性神经发育障碍
在这篇预印本中,一个国际团队首次表明,“alu介导的非等位基因同源重组促进了从头结构变异,导致非编码元件(lncRNA CHASERR)的缺失,从而导致罕见的综合征性神经发育障碍”。该团队使用PacBio长读测序来解析SV,并识别出三个与缺失相关的相邻从头SNPs。
编码长链非编码rna (lncRNA)的基因占人类基因组的很大一部分,但lncRNA的单倍不足尚未被证明会导致孟德尔病。CHASERR是一种高度保守的人类lncRNA,与chd2(一种编码基因,其新生功能丧失变异可导致发育性和癫痫性脑病)相邻。在这里,我们报告了三个不相关的个体,每个个体在CHASERR位点上都有一个超罕见的杂合从头缺失。我们报道了这些个体在严重发育迟缓、面部畸形和大脑髓化异常方面的相似之处,将它们与CHD2单倍不全的表型谱区分开来。我们发现,在全血和患者来源的细胞系中,CHASERR mRNA表达减少,CHD2 mRNA和蛋白相应增加,特别是CHD2等位基因的表达随CHASERR缺失顺式增加,这与先前的CHASERR单倍功能不全小鼠模型预测的一样。我们首次表明,alu介导的非等位基因同源重组促进了从头结构变异,导致非编码元件(lncRNA CHASERR)的缺失,从而导致罕见的综合征性神经发育障碍。我们还证明了CHD2在人类疾病中具有双向剂量敏感性。这项工作强调了仔细评估其他lncRNA的必要性,特别是那些与孟德尔疾病相关的上游基因。
神经生物学/ Iso-Seq方法:全长转录序列追踪家鼠自然种群的大脑同种异构体多样性
在这篇预印本中,来自德国和中国的科学家团队对来自远交小鼠种群和亚种的48个个体进行了PacBio全长RNA测序(Iso-Seq),代表了“迄今为止种群水平上最大的全长高质量亚型目录”。
关键要点:
作者指出,“自然种群中可选择的同种异构体的复杂性和多样性在很大程度上仍未被探索”。
在这项研究中发现了超过11.7万个不同的转录本,“其中只有51%之前被注释过”。
在解释他们的结果时,研究小组发现“古老的管家基因是整体同种异构体多样性的主要来源,而替代第一外显子的招募在产生新的同种异构体方面起着主导作用。”
结论:“鉴于我们的数据可以区分种群特异性同种异构体和在多个种群中保守的同种异构体,有可能将参考小鼠基因组的注释细化为一组大约40,000种同种异构体,这些同种异构体应该与跨物种的比较功能分析最相关。”
在真核生物中,产生同一基因转录本的多个RNA同工型的能力是一种普遍现象。然而,在自然种群中替代同种异构体的复杂性和多样性在很大程度上仍未被探索。利用新开发的全长转录本富集方案,我们对来自小家鼠近交种群和亚种的48个个体的全长RNA转录本进行了测序,并将近亲姐妹种小家鼠和小家鼠作为外群。这是迄今为止在种群水平上最大的全长高质量同种异构体目录。总的来说,我们可靠地鉴定出117,728个不同的转录本,其中只有51%之前被注释过。我们发现,同种异构体的种群特异性分布模式具有系统发育信息,并反映了种群之间分离的SNP多样性。我们发现,古代管家基因是整体同工异构体多样性的主要来源,替代第一外显子的招募在产生新的同工异构体中起主导作用。鉴于我们的数据可以区分种群特异性同种异构体和在多个种群中保守的同种异构体,因此有可能将参考小鼠基因组的注释细化为一组大约40,000种同种异构体,这些同种异构体应该与跨物种的比较功能分析最相关。
农业基因组学:大麦结构变异的适应性多样化
在这份预印本中,来自23个全球机构的科学家进行了国际合作,展示了大麦的泛基因组,其中包括来自76个野生和驯化基因组的HiFi组装。
关键要点:
该泛基因组的完成扩大了“作物序列变异目录”,“包括结构复杂的位点”。
这些基因座包括那些与抗病、植物结构、养分释放和毛状体发育有关的基因座。
结论:“我们的研究结果表明,结构复杂位点的快速进化可能有助于作物适应农业生态系统中新的选择性制度。”
泛基因组是一个物种的多个个体的带注释的基因组序列的集合。这些数据集揭示的结构变异是作物遗传分析的主要资产。在这里,我们报告了大麦的全基因组,包括76个野生和驯化基因组的长读序列组装和1315个基因型的短读序列数据。扩大的作物序列变异目录包括结构复杂的位点,这些位点已成为近年来进化中基因拷贝数变异的热点。为了证明泛基因组的效用,我们重点研究了涉及抗病、植物结构、营养释放和毛状体发育的四个位点。在一个白粉病抗性位点上发现了新的等位基因变异,并在营养分枝调控中发现了种群特异性拷贝数增加。优质麦芽中淀粉裂解酶家族的扩展与微量麦芽试验中酶活性的变化有关。一个增强子基序的缺失可能会改变大麦籽粒毛状附属物的发育轨迹。我们的研究结果表明,结构复杂位点的快速进化可能有助于作物适应农业生态系统中新的选择机制。
这些最近的出版物体现了PacBio测序的多功能性和力量。从生物信息学的进步到复杂癌症生物学的阐明,PacBio技术使科学先驱能够实现前所未有的创新突破。
由于仪器融资的新选择或与认证服务提供商的合作,PacBio测序现在对各种规模的研究团队都更容易获得。要了解如何将PacBio数据整合到您的下一个项目中:与PacBio科学家联系
知名企业招聘