PacBio HiFi测序技术:8月精选文章 他山之石 启发灵感

【字体: 时间:2024年09月03日 来源:PacBio

编辑推荐:

  PacBio HiFi测序技术使基因组学专家们能够在发现和探索各个生物领域的新领域方面处于领先地位。在这一期的PacBio博客重点介绍了2024年8月的科学论文。从SBB化学优势的文献证据,到看到HiFi如何在等位基因特异性表达分析方面表现出色,为人类进化研究提供明确的基线——这些论文展示了PacBio技术如何推动基因组研究的未来。

  

 切入主题: 了解PacBio Onso测序:Q 40+ 准确率的达成和应用优势 —— PacBio Onso 测序仪简介

Onso等位基因特异性表达的SBB化学研究 


1. Sequencing by binding rivals SMOR error-corrected sequencing by synthesis technology for accurate detection and quantification of minor (<0.1%subpopulation variants)

在第一篇发表在Onso和SBB技术上的同行评议论文中,研究人员证明了Onso与ILMN SBS技术相比具有更高的准确性和精确度。研究人员将用于鉴定和量化结核分枝杆菌(Mtb)样本中罕见耐药亚群的靶向SBB测序,与带SMOR纠错、以及无纠错的靶向SBS测序进行了比较。该研究使用了30份人造Mtb样品,其中含有10%,1%,0.1%,0.01%和0.001%频率的katG g944c或gyrA a241g抗性突变,均用SBB和SBS测序。

研究结果:

  • Onso SBB在100K深度检测到频率为0.01 - 0.001%的突变,在20K深度检测到频率>0.1%的突变,没有纠错方法,与SBS相比提高了10倍,与纠错SBS数据相当,——“100,000倍的深度提高了检测katG g944c超低变异频率的能力,SBS-SMOR低至0.01%,SBB低至0.001%。”(论文引用)

  • PacBio SBB测序数据的经验错误率(Empirical error )和假阳性读取也更低——“总体而言,SBS-SMOR和SBB观察到的错误分别比SBS单独减少8.3倍和8.5倍。”

  • 总的来说,作者提出SBB作为一种强大的替代方案,可以在各种应用中无需复杂纠错地检测罕见突变:“SBB测序化学在10万倍深度下检测到目标SNP低至0.01%,在2万倍深度下检测到0.1%,无需任何纠错方法。如果不使用复杂的纠错工具(如SMOR、UMI、duplex等),传统的SBS测序无法达到这种准确性”。

注:这里的结果仅通过单端读取和商用前的测序试剂获得。PacBio期望通过当前的配对端试剂来改进这些结果,这将进一步验证作者的假设,即“将错误校正方法与SBB测序相结合……有可能进一步显著降低测序错误率。”

结论

SBB提供了一种非凡和高度准确的方法,以低至0.001%的频率检测耐药Mtb的少数群体,而不需要复杂的纠错技术,如UMIs或SMOR。它还通过降低错误率和简化过程解决了ILMN SBS的局限性,使其成为早期发现结核分枝杆菌异耐药性的关键工具,这对于应对耐药结核病至关重要。广泛应用,这种能力为检测肿瘤来源的无细胞DNA的液体活检样本中的癌细胞和其他传染病应用(如废水检测)提供了优势。


对PacBio的SBB感兴趣? 了解PacBio Onso测序:Q 40+ 准确率的达成和应用优势 —— PacBio Onso 测序仪简介


2. Experimental and computational methods for allelic imbalance analysis from single nucleus RNA-seq data

在最近的一份预印本中,来自帕金森病科学研究、Broad、耶鲁、哈佛、Banner Sun AZ和Genentech的研究人员对“等位基因特异性表达(ASE)分析,以更好地了解人类基因组的变异如何影响单细胞水平的RNA表达”的方案进行了详细的分析。该研究采用单核RNA-Seq (snRNA-Seq)作为杂合变异富集的pre-mRNA中的内含子,从而促进了ASE的等位基因分配,得出结论,与ILMN短读相比,HiFi更准确、更经济、更能分辨等位基因特异性表达(ASE)。

主要结论:

  • 比较Illumina、HiFi和ONT:

    • 准确性:“PacBio和MAS-seq的错误率较低,有更多的索引,但是比Illumina少错配[>4倍的错配错误率],而基于ONT的方法错误率更高。“(尽管后者使用了R2C2

    • 运行通量:“总体而言,除了使用Revio的MAS-seq外,我们用Illumina获得的定相UMI (phased UMIs)仍然多于用长读技术获得的定相 UMIs。这表明MAS-seq和Illumina都是对snRNA-seq数据进行基因水平ASE分析的强大方法”。

    • 读取值/成本:“对于每一个MAS-seq分段读取(S-read),需要测序大约7个Illumina读取(read 2中有130bp)来获得相同数量的定相UMI,尽管确切的数量取决于饱和度,所以如果MAS-seq中一个S-read的成本能够小于7倍的Illumina读取成本,那么MAS-seq将比Illumina更具成本效益。”

  • 异构体分辨率:“在异构体水平的ASE分析中,MAS-Seq具有比短读数据更大的优势。“这是一个关键的结果,正如许多研究已经表明,同一基因的不同的同种异构体往往具有非常不同的功能,因此同种异构体表达——而非基因表达——决定生物学和疾病]

结论

HiFi测序提供了更详细的异构体水平ASE分析,捕获了短读测序所遗漏的复杂转录组变化。通过具有成本效益和自动化的解决方案,如在Revio系统上的Kinnex scNRNA工作流程,HiFi测序提供了对转录调控的更深入的了解,并提高了对基因组变异如何影响细胞功能的理解。

 

基因遗传


3. A familial, telomere-to-telomere reference for human de novo mutation and recombination from a four-generation pedigree

在一份由华盛顿大学和另外18个机构领导的预印本中,研究人员使用HiFi测序揭开了四代基因遗传的秘密。这项研究标志着“所有类别的基因组变异中最全面、最公开的‘真相集’”:

亮点包括:

  • 在一个四代,28个成员的家庭进行近端粒到端粒定相的基因组组装(Near-telomere-to-telomere phased genome assemblies,多种技术,混合verkko和hifiasm)

  • 使用HiFi测序发现新的SNVs和Indels突变,以及TRGT和TRGT-denovo的STRs和VNTRs突变(利用其他技术进行正交支持)

  • 这一发现是:“与Genome in a Bottle (GIAB) (2.51 Gbp)或Illumina WGS数据(2.58 Gbp)相比,利用家谱背景下的长读序列数据可以获得额外的约244 Mbp人类基因组(2.76 Gbp高置信度区域),其中包括两项研究中都没有出现的194 Mbp。”

  • 研究人员能够详细地分析突变读取集,序列解析重组映射, de novo SNV和小indels,de novo串联重复和复发性突变,着丝粒家族遗传和de novo SVs, Y染色体突变,全基因组de novo SVs。

  • “大多数(以前的)使用短读测序建立de novo突变(DNM)率的研究普遍为每代60-70个DNM,然而,这在很大程度上排除了基因组的高度可变区域,例如长TR、SDs和卫星序列。”. “在这个多代谱系中,我们估计每代有128-259个DNM。”也就是说,是之前假设的数字的两倍或四倍!

结论

HiFi测序为研究de novo突变(DNMs)提供了全面、准确的方法,特别是在短读方法经常会错过的复杂的基因组区域——如着丝粒和Y染色体。解决具有挑战性领域的能力使HiFi测序成为检测更广泛突变的最可靠工具,显著推进了我们对遗传疾病、表型变异和人类进化的理解。值得注意的是,虽然这项具有里程碑意义的研究使用了来自五种不同的短读和长读技术的数据,但PacBio HiFi测序贡献了大部分数据。

 

进化


4. 完成猿基因组测序

最后,由华盛顿大学联合其他59个机构领导的预印本为我们对人类意义的理解提供了一个重大飞跃。通过这项研究,研究人员获得了“未来所有人类和我们最亲近的类人猿近亲进化研究的明确基线”:

  • 通过单倍型分辨的参考基因组和对六种猿类的比较分析,研究人员从端粒到端粒、无间隙地完全测序了215条染色体,实现了卓越的序列准确性(50万碱基对误差<1)和染色体水平的连续性。

  • “每个基因组组装都由NCBI注释(包括使用Iso-Seq从每个样本中生成的50 Gb全长cDNA),并已被用作RefSeq的主要参考,取代了以前基于短或长读取的不完整版本的基因组,并用新组装和修饰的版本更新了性染色体。”

  • 详细分析,包括:序列差异(包括通过揭示基因组快速进化和结构变异区域中受影响的Mbp差异高出5-15倍,对“黑猩猩和人类之间经常引用的~ 99%序列一致性统计数据”的改进)、物种形成时间和不完整谱系分类、基因注释、重复注释和移动元素插入鉴定、选择和多样性、免疫球蛋白和MHC位点、免疫球蛋白和T细胞受体位点、表观遗传特征、进化重排和类人猿序列倒位,结构分化和突变加速区,单中心染色体和核仁组织区,着丝粒卫星进化,亚末端异染色质,谱系特异性片段复制和基因家族。

结论

只有长读测序才能解决10%-15%的高度分化、以前不可及的类人猿基因组区域——这些区域对理解复杂性状至关重要。在Revio系统上通过使用HP96工作流程的WGS提供高质量的单倍型解析参考基因组,研究人员可以增强他们对猿类物种进化和功能差异的理解,提供可应用于人类健康的有价值的见解。

 

准备好启动你自己的突破了吗?


这些出版物突出了PacBio测序的卓越能力。从优于传统方法的Onso系统到为进化研究设定新标准的HiFi测序,PacBio技术使研究人员每天都能做出新的突破性发现。了解如何加入下一个发现时代,并了解如何将PacBio数据纳入您的下一个项目:

与PacBio的科学家联系

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号