-
生物通官微
陪你抓住生命科技
跳动的脉搏
《Nature Biotechnology》AI与CRISPR联手,基因表达得到精确控制
【字体: 大 中 小 】 时间:2023年07月04日 来源:Nature Biotechnology
编辑推荐:
这项研究将深度学习模型与CRISPR筛选结合起来,以不同的方式控制人类基因的表达,比如轻按电灯开关完全关闭它们,或者使用调光旋钮部分降低它们的活性。这些精确的基因控制可以用来开发新的基于CRISPR的疗法。
根据发表在《Nature Biotechnology》上的一项新研究,人工智能可以预测靶向RNA而非DNA的CRISPR工具的靶向和脱靶活动。这项研究由纽约大学、哥伦比亚工程学院和纽约基因组中心的研究人员进行,他们将深度学习模型与CRISPR筛选结合起来,以不同的方式控制人类基因的表达——比如轻按电灯开关完全关闭它们,或者使用调光旋钮部分降低它们的活性。这些精确的基因控制可以用来开发新的基于CRISPR的疗法。
CRISPR是一种基因编辑技术,在生物医学和其他领域有许多用途,从治疗镰状细胞性贫血到改造更美味的芥菜。它通常通过一种叫做Cas9的酶靶向DNA起作用。近年来,科学家们发现了另一种类型的CRISPR,它使用一种名为Cas13的酶来靶向RNA。
RNA靶向CRISPR可用于广泛的应用,包括RNA编辑,敲低RNA以阻断特定基因的表达,以及高通量筛选以确定有希望的候选药物。纽约大学和纽约基因组中心的研究人员创建了一个使用Cas13的RNA靶向CRISPR筛选平台,以更好地了解RNA调控并识别非编码RNA的功能。由于RNA是包括SARS-CoV-2和流感在内的病毒的主要遗传物质,因此靶向RNA的CRISPR也有望开发预防或治疗病毒感染的新方法。同样,在人类细胞中,当一个基因被表达时,第一步就是从基因组中的DNA中产生RNA。
该研究的一个关键目标是最大化靶向RNA的CRISPR在预期靶RNA上的活性,并最小化可能对细胞产生有害副作用的其他RNA的活性。脱靶活性包括向导RNA和靶RNA不匹配以及插入和删除突变。早期对RNA靶向CRISPR的研究只关注靶标活性和错配;预测脱靶活性,特别是插入和删除突变,还没有得到很好的研究。在人类群体中,大约五分之一的突变是插入或缺失,因此这些是CRISPR设计中需要考虑的重要的潜在脱靶类型。
纽约大学生物学副教授、纽约大学格罗斯曼医学院神经科学和生理学副教授、纽约基因组中心核心教员、该研究的共同通讯作者Neville Sanjana说:“与Cas9等DNA靶向CRISPR类似,我们预计Cas13等RNA靶向CRISPR将在未来几年对分子生物学和生物医学应用产生巨大影响。准确的指南预测和脱靶识别将对这一新兴领域和治疗方法具有巨大价值。”
在他们发表在《Nature Biotechnology》上的研究中,Sanjana和他的同事们在人类细胞中进行了一系列针对RNA的CRISPR筛选。他们测量了20万个靶向人类细胞中必需基因的引导RNA的活性,包括“完美匹配”的引导RNA和脱靶错配、插入和缺失。
Sanjana的实验室与机器学习专家David Knowles的实验室合作,设计了一个深度学习模型,他们将其命名为TIGER(通过引导RNA设计靶向抑制基因表达),该模型是根据CRISPR筛选上的数据进行训练的。通过比较深度学习模型和人类细胞实验室测试产生的预测,TIGER能够预测靶标和脱靶活性,优于先前为Cas13靶标指导设计开发的模型,并提供了预测RNA靶向CRISPR脱靶活性的第一个工具。
“机器学习和深度学习在基因组学中显示出它们的优势,因为它们可以利用现代高通量实验产生的庞大数据集。重要的是,我们还能够使用“可解释的机器学习”来理解为什么模型预测特定指南会很好地工作,“Knowles说。
“我们早期的研究展示了如何设计能够敲低特定RNA的Cas13向导。“有了TIGER,我们现在可以设计Cas13指南,在靶上敲除和避免脱靶活动之间取得平衡,”该研究的共同第一作者、纽约基因组中心的高级科学家Hans-Hermann (Harm) Wessels说。
研究人员还证明,TIGER的脱靶预测可以用来精确调节基因剂量——特定基因的表达量——通过在有错配向导的细胞中实现基因表达的部分抑制。这可能对基因拷贝过多的疾病有用,如唐氏综合症、某些形式的精神分裂症、腓骨肌萎缩症(一种遗传性神经紊乱),或基因异常表达可能导致肿瘤不受控制生长的癌症。
“我们的深度学习模型不仅可以告诉我们如何设计一个完全破坏转录本的向导RNA,还可以‘调整’它——例如,让它只产生特定基因转录本的70%,”哥伦比亚工程和纽约基因组中心的博士生Andrew Stirn说,他是该研究的第一作者之一。
通过将人工智能与RNA靶向CRISPR筛选相结合,研究人员设想TIGER的预测将有助于避免不希望的脱靶CRISPR活动,并进一步促进新一代RNA靶向疗法的发展。
“随着我们从CRISPR筛选上收集更大的数据集,应用复杂机器学习模型的机会正在迅速增加。我们很幸运,大卫的实验室就在我们隔壁,以促进这一美妙的跨学科合作。而且,有了TIGER,我们可以预测脱靶,并精确地调节基因剂量,这使得靶向RNA的CRISPR在生物医学上有了许多令人兴奋的新应用。”
Prediction of on-target and off-target activity of CRISPR–Cas13d guide RNAs using deep learning Nature Biotechnology, 2023