-
生物通官微
陪你抓住生命科技
跳动的脉搏
同济大学刘琦教授Cell子刊探讨CRISPR的in-silico sgRNA设计
【字体: 大 中 小 】 时间:2016年07月26日 来源:同济大学
编辑推荐:
同济大学生命科学与技术学院刘琦教授课题组受邀在Cell子刊,Trends系列著名杂志《Trends in Biotechnology》(影响因子:12)发表论文,系统探讨了CRISPR基因编辑系统中的in-silico sgRNA设计问题。
CRISPR/Cas9系统是目前进行基因编辑的有效技术。实现CRISPR/Cas9系统的核心问题之一是进行高效以及特异性的sgRNA设计。近日,同济大学生命科学与技术学院刘琦教授课题组受邀在Cell子刊,Trends系列著名杂志《Trends in Biotechnology》(影响因子:12)发表论文,系统探讨了CRISPR基因编辑系统中的in-silico sgRNA设计问题。
刘琦教授课题组以数据挖掘和机器学习计算技术为基础,重点关注于生物医药大数据挖掘领域的交叉问题研究,在基因编辑的小RNA设计以及肿瘤精准医疗,多组学数据分析以及药物基因组学、药物信息学领域进行了一系列的研究工作。这工作的第一作者为生命科学与技术学院的直博二年级学生啜国晖,项目得到了国家自然科学基金和上海市科委的资助。
CRISPR/Cas 是细菌和古生菌抵抗病毒或外源质粒入侵的获得性免疫系统,其中最常用的II型系统能编码tracrRNA(Trans-activating crRNA),指导 RNaseIII和 Cas9 完成前体 crRNA 的成熟,然后tracrRNA 与成熟的 crRNA 的互补序列配对形成 RNA 二聚体,作为向导 RNA(Guide RNA,gRNA) ,引导 Cas9 蛋白识别和降解入侵的外源 DNA。通过人工设计,研究者将tracrRNA/crRNA 二聚体改造成单一向导 RNA(Single guide RNA, sgRNA),极大方便了基因组编辑技术的研究。
此前刘琦教授曾与温州医科大学眼视光重点实验室的谷峰教授合作,通过计算手段,整合多细胞系的基因敲除后的高通量测序数据,基于可靠的统计检验,系统研究了多细胞系下CRISPR/Cas9系统基因敲除过程中microhomology和in-frame mutation发生率之间的关系,澄清了前人工作中关于microhomology pattern和in-frame mutation occurrence密切相关的结论(Kim J.S. et al, Nature Methods, 2015),并且进行了实验验证。同济大学、温州医科大学发表文章解析CRISPR基因编辑系统
在此基础上,研究者首次总结出了当前最全面的CRISPR基因编辑计算工具列表,包含36个in-silico sgRNA设计工具以及7个基因编辑测序数据分析平台。这些工具涵盖了
(1)in-silico on-target设计;
(2)in-silico off-target设计;
(3)CRISPRi/a设计
(4)posterior CRISPR数据分析以及CRISPR screening分析等方面,并从平台设计及计算方法等角度对这些工具进行了系统的评价和讨论。
基于上述总结,研究者进一步指出了该领域的若干重要研究问题和方向,包括:
(1)系统的比较不同CRISPR系统以及不同工具在不同细胞系下的设计特异性和灵敏度;
(2)不同细胞系下的sgRNA设计存在不一致性;
(3)发展有效的CRISPR脱靶检测技术,进一步评估CRISPR系统的脱靶率,
(4)开发面向特异细胞系及细胞环境的CRISPR设计技术和方法等。
原文摘要:
In Silico Meets In Vivo: Towards Computational CRISPR-Based sgRNA Design
CRISPR-based genome editing has been widely implemented in various cell types.
In silico single guide RNA (sgRNA) design is a key step for successful gene
editing using the CRISPR system, and continuing efforts are aimed at refining in
silico sgRNA design with high on-target efficacy and reduced off-target effects.
Many sgRNA design tools are available, but careful assessments of their
application scenarios and performance benchmarks across different types of
genome-editing data are needed. Efficient in silico models can be built that
integrate current heterogeneous genome-editing data to derive unbiased sgRNA
design rules and identify key features for improving sgRNA design. Comprehensive
evaluation of on-target and off-target effects of sgRNA will allow more precise
genome editing and gene therapies using the CRISPR system.