-
生物通官微
陪你抓住生命科技
跳动的脉搏
我学者开发精确的CRISPR注释程序
【字体: 大 中 小 】 时间:2016年09月12日 来源:生物通
编辑推荐:
近期,来自中科院深圳先进技术研究院、湖北工业大学和吉林大学等处的研究人员,在《Scientific Reports》发表一项研究,提出了一种精确的从头CRISPR注释程序——CRISPRdigger,可以将一部分组装的基因组作为其输入。
生物通报道:CRISPR系统对于原核生物免疫系统对抗入侵元素发挥关键的作用,也被设计成促进真核生物基因组的靶向基因编辑。近期,来自中科院深圳先进技术研究院、湖北工业大学和吉林大学等处的研究人员,在《Scientific Reports》发表一项研究,提出了一种精确的从头CRISPR注释程序——CRISPRdigger,可以将一部分组装的基因组作为其输入。点击阅读更多CRISPR生物信息学研究:刘小乐教授发布CRISPR研究新工具;快速标识CRISPR系统PAMs的新工具;刘小乐教授:CRISPR高通量筛选的新算法。
这项研究的通讯作者是吉林大学计算机科学与技术学院的周丰丰教授,其2000年本科毕业于中国科学技术大学少年班,2005年在中国科学技术大学计算机学院获博士学位,是吉林大学“唐敖庆”教授,博士生导师,中国科学院****,IEEE(美国电气和电子工程师协会)高级会员,主要从事健康大数据挖掘核心算法的研究。
CRISPRs是原核生物基因组中的重要遗传因素,可从外来元素(如噬菌体)积极获取模板序列,用于随后的序列特异性切割。这些外来模板序列的长度从24到48 bp不等,其中穿插分布着保守的重复序列。一种CRISPR通常是由结合在其密切侧翼区上的前导区的一个相邻CRISPR相关(Cas)基因转录的。在超过40%的已测序的原核基因组中,CRISPR / CAS系统充当一种反入侵的免疫机制。
作为一种真核生物基因组编辑技术,CRISPR/Cas系统吸引了相当多的关注,因为它可切割特定的序列信号。发展最好的酶是来自化脓性链球菌的核酸酶Cas9,用一段合适的向导RNA片段,它可能在任何基因组的位置进行切割。另一种广泛使用的基因组编辑技术TALEN,需要研究人员为每个靶基因组位置合成一种核酸酶,比起只合成一种向导RNA,这成本更高,而且更费时。随着临床应用对靶专一性的要求越来越高,目前已经推出了一些Cas9突变体,它们具有超过50倍的较高特异性。
目前,已经开发出一些计算机程序,用于原核基因组中天然CRISPR的从头检测。自上世纪80年代被发现以来,研究人员已经分析了2762个原核生物基因组,在47.14%的基因组中检测到了CRISPRs,平均每个基因组有1.47个CRISPR。然而,原核生物的基因组测序在加速,在2015年9月,NCBI的微生物基因组数据库中就包含了4278个基因组。因此,在一个新完成测序的原核生物基因组中从头注释CRISPRs,对于更好地了解这个免疫系统是必要的。PILER-CR来源于重复检测程序PILER20,并在一个小的基因组中筛选CRISPRs。CRT筛选一个基因组中确切的k-mer / k-nucleotide重复序列,并将相邻的重复序列连接到候选CRISPRs。CRISPRFinder使用Vmatch来检测连续定位的重复序列,并能够更好地注释DR边界和短CRISPRs。
本研究提出了一种新的从头CRISPR检测程序——CRISPRdigger,并重点检测弱的DR信号,在当前的文献中这通常是被错过了。从头重复检测程序RepeatScout被用来在一系列的序列长度范围内找到重复拷贝。在这些重复拷贝被聚类之后,弱的DR副本被RepeatMasker注释——通过将模板DRs映射到基因组中。与现有程序的比较是基于来自dbCRISPR数据库的金标准CRISPR注释,在2014四月14日进行了更新。
研究人员发现,dbCRISPR包括DRs和间隔的所有的位置和序列信息。它比其他程序更方便和准确。实验数据表明,CRISPRdigger可能是对现有工具的一个很好的补充。该论文对本研究所使用的数据和crisprdigger算法进行了描述,接着对dbCRISPR中注释的CRISPRs进行了基本概述,并对CRISPRdigger与现有的程序进行了综合比较。
(生物通:王英)
生物通推荐原文摘要:
CRISPRdigger: detecting CRISPRs with better direct repeat annotations
Abstract: Clustered regularly interspaced short palindromic repeats (CRISPRs) are important genetic elements in many bacterial and archaeal genomes, and play a key role in prokaryote immune systems’ fight against invasive foreign elements. The CRISPR system has also been engineered to facilitate target gene editing in eukaryotic genomes. Using the common features of mis-annotated CRISPRs in prokaryotic genomes, this study proposed an accurate de novo CRISPR annotation program CRISPRdigger, which can take a partially assembled genome as its input. A comprehensive comparison with the three existing programs demonstrated that CRISPRdigger can recover more Direct Repeats (DRs) for CRISPRs and achieve a higher accuracy for a query genome. The program was implemented by Perl and all the parameters had default values, so that a user could annotate CRISPRs in a query genome by supplying only a genome sequence in the FASTA format. All the supplementary data are available at http://www.healthinformaticslab.org/supp/.