
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:利用CRISPR技术推动染色体基因多样化和人工进化
【字体: 大 中 小 】 时间:2025年09月24日 来源:Genome Biology 9.4
编辑推荐:
这篇综述系统阐述了CRISPR技术如何革新染色体基因多样化和人工进化领域。文章详细比较了CRISPR介导的同源定向修复(HDR)、碱基编辑(BE)、引物编辑(PE)等技术在功能基因组学研究、蛋白质进化、代谢工程和疾病建模中的应用,重点分析了各种方法的编辑窗口、突变类型和适用范围,为(定向进化)、(功能基因组筛选)和(合成生物学)提供了重要技术参考。
基因多样化是产生大量遗传变异体的过程,有助于功能序列的筛选分析。通过迭代多样化和选择,可以改进基因和蛋白质功能,推动生物技术创新。传统方法如易错PCR、位点饱和突变和DNA改组存在局限性,通常需要将突变文库引入宿主生物并进行异位表达,这既繁琐又受宿主依赖的转化效率限制。虽然体内连续进化系统避免了迭代克隆和转化步骤,但仍需在质粒或非天然基因组位点表达目的基因,无法模拟内源调控环境。此外,一些物种(如植物)中尚未建立异位表达系统,且大型结构变异(如大片段缺失、重复、倒位和易位)在体外合成成本高昂。
染色体基因多样化指在天然染色体位置直接产生遗传变异,支持可靠的原位功能分析。传统方法如自发、化学或物理诱变效率低、突变频率低,且突变在全基因组随机分布。寡核苷酸介导的重组工程是向染色体基因多样化迈出的重要一步,但迄今仅成功应用于细菌物种和酵母转基因。近年来,传统重组工程通过使用CRISPR/Cas系统产生靶向DNA双链断裂(DSB)来提高诱变频率,促进了基于同源定向修复(HDR)的变异工程方法在细菌、酵母和人类细胞系中的发展。其他不依赖重组的方法也得以开发,使同源重组效率低的物种实现基因多样化。这些方法包括使用失活或切口Cas蛋白与脱氨酶、逆转录酶和易错DNA聚合酶结合。借助CRISPR技术,通过简单地生成单导RNA(sgRNA)文库即可实现大规模靶向染色体基因多样化,支持快速探究多种物种中的细胞过程,并助力从治疗药物到生物基产品等有用产品的开发。
CRISPR/Cas系统是细菌的先天免疫系统,能够识别、结合和切割外来核酸。根据效应复合体结构,CRISPR/Cas系统分为两大类和六种类型。1类系统使用多亚基效应复合体,包括I型(标志蛋白:Cas3)、III型(Cas10)和IV型系统。2类系统使用单蛋白效应器,包括II型(Cas9)、V型(Cas12)和VI型(Cas13)。值得注意的是,Cas9和Cas12主要靶向DNA,而Cas13专门用于RNA切割。自发现以来,各种CRISPR/Cas系统已被改造和重编程为精确基因组编辑工具。迄今最广泛使用的系统是化脓链球菌的II类CRISPR/Cas9系统。在该系统中,Cas9蛋白通过sgRNA靶向至被称为原间隔区的基因组位点,其序列与原间隔区相邻基序(PAM)相邻,并与sgRNA的引导序列匹配。随后切割目标DNA产生DSB,通过宿主细胞的非同源末端连接(NHEJ)或HDR途径修复。dCas9(失活Cas9)和nCas9(切口酶Cas9)是通过使Cas9的两个核酸酶结构域(HNH和RuvC)失活(dCas9)或单个核酸酶结构域(nCas9)获得的突变体。dCas9缺乏DNA切割活性,但保留准确靶向和结合DNA的能力,使其成为附加效应蛋白的招募平台。nCas9保留切割一条DNA链的能力,促进高级基因组编辑技术如碱基编辑和引物编辑。
染色体基因多样化通常需要使用覆盖目标区域的基因组编辑剂文库。早期基因组编辑工具,即锌指核酸酶(ZFNs)和转录激活因子样效应物核酸酶(TALENs),存在蛋白质设计复杂、分子克隆成本高以及仅具切割功能等问题,阻碍了基因多样化文库的简便生成。因此,TALEN文库主要用于基因敲除。直到最近,利用先进机器学习模型才解决了设计特定锌指阵列的挑战。相比之下,CRISPR/Cas系统的高效性、易编程性和成本效益推动了其在不同物种中的广泛应用。通过简单构建sgRNA文库,CRISPR的靶向范围即可覆盖完整基因或长基因组区域。
由于对HDR高度保守机制和成熟实验协议的数十年研究,HDR首先被用于引入用户定义的精确突变库并不令人惊讶。体内自发同源重组效率通常较低。一项里程碑研究表明,人工引入的DSB通过触发同源重组修复途径,大大提高了携带同源序列的外源DNA的靶向整合效率。这种提升的效率允许使用大规模体外合成的HDR模板进行基因组整合,这些模板包含合理设计或饱和突变,遵循CRISPR/Cas9的DNA切割(本文中称为CRISPR-HDR策略)。
在人类细胞系中首次证明,可以使用饱和编辑对染色体基因进行多样化,这涉及通过sgRNA进行单次基因组切割,随后与体外合成的诱变供体质粒文库进行重组。此后,多项研究报道使用CRISPR结合同源重组进行饱和编辑和功能分析,针对各种疾病相关基因的外显子区域。与传统方法不同,CRISPR-HDR能够高通量生成和分析遗传变异,包括那些意义不确定的变异。通过引入靶向突变并在选择(如药物治疗)前后跟踪变异丰度,研究人员可以更快速地系统评估这些变异的功能影响。然而,由于哺乳动物细胞中HDR效率普遍较低,针对每个外显子的HDR模板通常需要两侧600至1000核苷酸长的同源臂以支持有效修复。在酵母中,开发了一种类似的方法称为Cas9介导的蛋白质进化反应(CasPER)。CasPER方法是一种稳健的定向进化技术,使用易错PCR(epPCR)创建大型突变文库,并通过Cas9介导的基因组编辑将这些变异整合到基因组环境中。CasPER允许以超过98%的效率整合300至600 bp的供体序列。该方法已证明可用于多样化内源非必需酵母基因,如甲羟戊酸途径基因,从而生成多样突变体并在选择后将类异戊二烯产量提高11倍。
虽然上述研究证明了使用单个sgRNA整合供体文库的可行性,但突变掺入效率在远离Cas9切割位点处趋于下降。因此,对每个预期突变使用附近的sgRNA是有利的。这种方法在同源重组系统高效的生物体(如某些工程细菌或酵母)中可行,其中较短的同源臂(通常40-100 bp)足够,因此允许大规模并行合成供体和附近引导物。基于这一概念,在大肠杆菌中开发了一种名为CRISPR启用可追踪基因组工程(CREATE)的基因多样化技术。CREATE整合CRISPR/Cas9与HDR,使用引导和供体对文库实现染色体基因的饱和突变。在该策略中,供体必须提供在sgRNA表达质粒上,以便引导和供体对物理连接并递送至同一细胞。在酵母中,我们也证明供体可以提供在sgRNA表达质粒上以实现高效基因编辑。使用类似的引导+供体策略,我们和其他人通过CRISPR-HDR在酵母中实现了基因多样化。我们的策略CHAnGE(CRISPR-Cas9和同源定向修复辅助的基因组规模工程)能够使用质粒文库进行染色体基因多样化和全基因组基因敲除。最近,我们通过使用PAM宽松的Cas9变体扩展了其靶向范围,并实现了CRISPR-Cas9和同源定向修复辅助的饱和编辑(称为CHASE)。使用概念上类似的方法,Roy等人开发了多重精确基因组编辑与短可追踪整合细胞条形码(MAGESTIC)。在该系统中,通过将供体DNA主动招募至Cas9切割位点,编辑效率提高了五倍以上,平均达到60%。此外,MAGESTIC通过基因组整合突变追踪条形码,提高了下游功能选择过程中突变追踪的保真度。同一引导+供体策略的其他变体也能够通过微小适应执行染色体基因多样化。
这些能够进行大规模多样化的CRISPR-HDR平台(CREATE、CHAnGE、MAGESTIC等)对微生物菌株工程特别具有变革性——该领域需要精确遗传修饰结合快速表型表征以用于工业应用。虽然传统的适应性实验室进化仍然广泛用于工业菌株改进,但CRISPR辅助的多样化现在提供了一种靶向替代方案,显著加速了这一过程。CRISPR-HDR的多功能性已通过成功多样化各种靶标得到证明,包括代谢基因、转录因子和启动子,促进了关键工业表型(如应激耐受)的进化。通过同时和可追踪地诱变代谢途径和调控元件,这些系统克服了先前通过数月非靶向进化解决的挑战。
虽然基于DNA的供体模板常用于CRISPR-HDR应用,但RNA也被证明可作为酵母中DSB修复的供体。鉴于此,CRISPR和RNA辅助的体内定向进化(CRAIDE)使用嵌合供体gRNA(cgRNA)进行Cas9靶向和DSB修复。cgRNA由易错T7 RNA聚合酶(epT7RNAP)持续产生,该酶将随机突变引入RNA模板,以整合到靶位点。CRAIDE用于通过靶向精氨酸转运体进化耐药性。然而,该方法的突变率比其他异位体内进化方法低2-3个数量级。其在进化复杂和工业相关性状方面的应用尚未探索。
尽管CRISPR-HDR方法在突变设计方面用途广泛,但Cas9切割可在靶位点产生随机插入和缺失,尤其是在偏好NHEJ的哺乳动物细胞系中。此外,靶向和脱靶切割可能导致染色体结构异常,如意外易位和大染色体片段丢失,可能混淆遗传变异功能的解释。为避免此问题,研究人员利用在单倍体细胞系或菌株中研究必需基因的优势,其中致死性indel和结构异常被清除,仅保留成功的HDR事件。除了indel和染色体不稳定的挑战外,CRISPR-HDR仅限于具有HR能力的细胞或细胞周期的特定阶段。因此,在某些应用和物种中,需要无DSB且不依赖HDR的方法。
此处我们首先说明使用一种不依赖HDR的方法,即CRISPR引导的脱氨酶,进行染色体基因多样化,其中相关脱氨酶直接转换核苷酸类型,无需DSB。
脱氨酶如激活诱导胞苷脱氨酶(AID)在CRISPR时代之前已被用于通过劫持Ramos B细胞中的天然体细胞超突变系统生成异源基因的遗传多样性。碱基编辑(BE)技术进一步使脱氨酶具有靶向可编程性,并在不同宿主细胞中得到更广泛的应用。第一代碱基编辑器将胞苷脱氨酶(CDA)与dCas9融合,诱导非模板链上的胞嘧啶脱氨基为尿嘧啶。在DNA复制过程中,该尿嘧啶被误识别为胸腺嘧啶,导致C:G至T:A的转换。为扩展突变类型,胞苷脱氨酶被腺苷脱氨酶(ADA)取代,从而发明了腺嘌呤碱基编辑器(ABE)。该编辑器介导腺嘌呤脱氨基为次黄嘌呤,在DNA复制过程中被识别为鸟嘌呤,实现A:T至G:C的转换。
两种碱基编辑工具,即靶向AID介导的诱变(TAM)和CRISPR-X,证明了胞苷碱基编辑器(CBEs)在指定染色体位点快速执行遗传多样化的能力。两种工具都整合了与AID复合的dCas9,能够在sgRNA引导下在目标区域产生广泛的单核苷酸突变。这些工具采用不同的胞苷脱氨酶招募策略。TAM将AIDx(一种AID变体)融合到dCas9的C末端,而CRISPR-X使用修饰的sgRNA支架,其茎环结构包含两个MS2结合位点,以招募与MS2蛋白融合的AID或高活性AID变体(AID*△)。
为增强突变类型的多样性,已开发了几种双碱基编辑工具。其中第一个工具饱和靶向内源诱变编辑器(STEMEs)将胞苷脱氨酶(APOBEC3)和腺苷脱氨酶(ecTadA-ecTadA7.10)以不同配置融合到nCas9的C末端。这允许在同一原间隔区内同时进行C至T和A至G的转换。通过进一步使用识别NG PAM序列的PAM柔性Cas9,STEME-NG实现了对56个氨基酸序列的近饱和诱变。除了常见的C:G至T:A和A:T至G:C转换外,STEME-NG还促进了较少见的C至G/A转换。靶向水稻乙酰辅酶A羧化酶(由OsACC基因编码)的羧基末端结构域的400个氨基酸,STEMEs成功诱导了具有增强除草剂抗性的突变体,并产生了多重突变。此外,不使用融合蛋白,多重正交碱基编辑(MoBE)也使用sgRNA支架同时招募ADA(TadA9)和CDA(CDA1),利用正交茎环实现随机双碱基编辑,这似乎是植物中CRISPR-X的升级版。
为提高基因治疗的编辑效率和准确性,CBEs最初设计为融合尿嘧啶糖基化酶抑制剂(UGI)以防止在通过错配修复去除尿嘧啶后形成无嘌呤/无嘧啶(AP)位点。对于基因多样化,消除UGI或用尿嘧啶DNA N-糖基化酶(UNG)替代可增强AP位点的形成,并促进目标序列的更多样化编辑。使用该策略,C至G碱基编辑器(CGBEs)通过省略UGI并掺入eUNG(来自大肠杆菌的UNG变体)实现高效的C至G颠换,同时仍保留较少见的C至A/T转换。在此基础上,miniAGBE将ABEs与CGBE结合,同时在靶位点产生A至G和C至G/T/A转换,编辑窗口分别为A4-A8和C3-C13。在耐药筛选中,通过使用miniAGBE对
生物通微信公众号
知名企业招聘