AID介导的原位靶点突变——哺乳动物DNA碱基编辑新技术

马云青 常 兴*
(中国科学院上海生命科学研究院健康科学研究所, 上海 200031)
 
 

常兴, 中国科学院上海生命科学研究院健康科学研究所研究员, 博士研究 生导师, 中组部青年千人计划、上海市浦江人才计划获得者。2001年获 北京大学理学学士, 2006年获美国俄亥俄州立大学博士学位, 2007年至 2011年在耶鲁大学免疫学系从事博士后研究; 2011年至2012年在拉霍亚 感染和免疫研究所任研究科学家。常兴课题组主要研究淋巴细胞发育和 免疫耐受的分子机制。在国际学术杂志Nat Methods、Immunity、elife、 J Exp Med、Blood、J Immunol上发表学术论文20余篇, 多篇论文及学术 成果被国际权威杂志重点报道。2014年起承担科技部973计划青年科学 家专题一项, 担任首席科学家。近期, 在Nat Methods上发表的研究成果 发现, 当把核酸酶缺陷的Cas9蛋白和诱导抗体高频突变的胞嘧啶脱氨酶 AID融合后, 在sgRNA靶向的基因组DNA上, 胞嘧啶和鸟嘌呤可以随机的 向其他三个碱基转变。这一新方法可以对细胞内的特定DNA序列进行 多样化, 完成遗传筛选, 从而分析单核苷酸突变的功能, 或者直接在哺乳 动物细胞内诱导蛋白进化。

 
 
1 单核苷酸基因编辑的现状

单核苷酸多样性是遗传多样性的主要来源, 是 分子进化的动力和很多疾病的直接诱因[1] 。例如, 单 核苷酸的多样性与肿瘤的发生息息相关, 大量测序 结果表明, 原癌基因和抑癌基因上的单核苷酸突变 是肿瘤发生的重要原因[2] 。除此之外, 激酶结构域是 肿瘤药物的治疗靶点, 然而编码激酶结构域基因中 的单核苷酸突变赋予肿瘤细胞耐药性, 向肿瘤治疗 提出了更高的挑战[3] 。另外, 因为单核苷酸的改变大 多不会破坏蛋白质的整体结构, 同时改变蛋白的功 能, 因此是分子进化的重要机制之一。

尽管单核苷酸突变是很多疾病的直接诱因, 但 无法通过常规的基因敲除或过表达来研究单核苷酸 突变与基因功能的关系。因此, 急需一种筛选工具 在基因组上靶向诱导单核苷酸突变, 产生大量多样 的功能突变体, 以用于研究单核苷酸突变与基因功 能的关系。

由于哺乳动物基因组的高度稳定性, 在哺乳 动物细胞内很难高效和高通量地诱导单核苷酸的 突变[4] 。另外, 实验室现有的体内单核苷酸突变方 法有其局限性, 如物理方法—紫外辐射, 突变频 率为1×10–10 ; 化学方法 —烷化剂乙基亚硝基脲(N-ethyl-N-nitrosourea, ENU), 引起错配, 单核苷酸 突变或者缺失, 突变频率为(1~1.5)×10–5[5] 。这些方 法效率极低, 且产生的突变方向随机, 突变图谱不均 一, 限制了它们的应用, 往往需要很大的工作量去确 定突变的位点。

作 为 细 菌 中 的 适 应 性 免 疫 机 制, CRISPR (clustered regularly interspaced short palindromic repeats)/Cas9[(CRISPR)-associated protein 9]是 近 年 来发展的一种便捷的基因组编辑技术, 可以使目标 基因删除和插入, 这些应用都是基于在sgRNA的介 导下, Cas9蛋白在目的基因处切割, 形成双链DNA断 裂(double strand breaks, DSBs), 从而对基因组进行 编辑[6-8] 。除此之外, 当RuvC结构域和HNH结构域同 时处于失活状态时(D10A&H840A; RuvC– &HNH– ), Cas9将不具有核酸酶活性, 成为dCas9(dead Cas9) [9] , 同样可以作为基因编辑工具。dCas9虽然没有剪切 DNA的能力, 但仍然可以在gRNA的引导下与特定 的DNA序列结合。前期研究表明, 通过将特定的转 录激活因子和抑制因子与dCas9复合体融合, 能够精 确地激活或沉默基因表达。例如, dCas9与多个VP16 结构域或KRAB(Kruppel-associated box domain)结合 进行转录激活或抑制。同时与相应的功能域结合,还能进行表观遗传修饰[10-11] 。

虽然CRISPR/Cas9方法可以精确地对DNA进行 编辑, 但受限于同源DNA修复的效率低的缺点, 因 此现在主要用于基因的敲除, 无法高效产生单核苷 酸突变[6-8] 。因此, 如何高效地在细胞内引入单核苷 酸突变被认为是基因编辑领域的重大挑战之一。

与大部分体细胞不同, 适应性免疫系统在B淋 巴细胞激活过程中可以对B细胞基因组的特定区 域进行高效编辑, 作为一种“突变自我”的机制, 对 抗原受体的可变区进行高频突变, 近乎无限的抗原 受体库, 用以抵御可能的病原体入侵[12-13] 。生发中 心B细胞特异性表达的激活诱导的胞嘧啶脱氨酶 (activation-induced cytidine deaminase, AID)是体细 胞高频突变的分子基础。AID将胞嘧啶脱氨基形成 尿嘧啶, 产生U-G碱基错配。U-G错配有两种修复路 径。第一种是, 如果错配不被及时修复, 在DNA复制 过程中, 产生C-T和G-A的突变。第二种是, U-G错配 被尿嘧啶DNA糖基化酶(uracil-N-glycosylase, UNG) 切除, 产生无嘧啶位点, 通过碱基切除修复引入非模 板依赖性的单核苷酸突变。前期研究表明, 在非B 细胞系中, 外源表达的AID突变效率会大幅下降, 且 AID的作用位点缺少靶向性[14] 。为解决这两个问题, 我们采用CRISPR/Cas9技术。

基于这些背景, 我们猜想, 通过dCas9蛋白与 AID融合, 将哺乳动物(体细胞高频突变)和古生菌的适应性免疫系统(CRISPR)结合, dCas9可以在sgRNA 的靶向作用下, 将AID招募到靶向区域, 并且可以提 高AID的局部浓度, 有效提高和扩展AID作用范围, 在非B细胞中针对特定基因实现高频突变, 产生遗 传多样性(图1)。

2 靶向性胞嘧啶脱氨酶(targeted AIDmediated mutagenesis, TAM)的靶向性和 高效性

为检测dCas9-AID融合蛋白的单核苷酸突变效 率, 我们首先在293T细胞中建立报告系统, 将绿色荧 光蛋白基因整合入293T基因组中。该绿色荧光蛋 白基因中部插入终止密码子TAG, 绿色荧光蛋白无 法正常表达; 只有当TAG突变向TAC/TAT时, 绿色荧 光蛋白才能正常表达。因此, 通过流式检测EGFP阳 性的细胞比例来指示单核苷酸突变效率。在报告细 胞中共转表达sgRNA和dCas9-AID两种质粒, 其中 sgRNA是针对EGFP终止密码子TAG的上下游100 bp 设计的4个sgRNA, 同时设置对照组在报告细胞中单 转AID。在转染后第7 d流式检测, AID组的EGFP+ % 约0.2%, 而共转dCas9-AID和针对TAG终止密码子 的sgRNA组的EGFP+ %达到2%, EGFP+ %得到10倍提 高。实验结果证明, dCas9-AID融合蛋白能有效纠正 GFP中的终止密码子(TAG)。

为了进一步优化dCas9-AID系统的效率, 我们将dCas9与不同的AID突变体融合, 其中, dCas9- P182X(C端核输出信号删除的AID突变体)效率最高, 相对于dCas9-AID效率得到2倍提高。因此, 我们使用 dCas9-P182X(dCas9-AIDx)进行后续实验。为了证明 确实是由AIDx与dCas9融合才赋予dCas9-AIDx融合 蛋白单核苷酸突变功能, 我们在报告子系统中分别共 转Cas9、dCas9、dCas9-AIDx(E58Q)(AID脱氨酶失活 突变体)、dCas9-AIDx和针对EGFP中终止密码子的4 个sgRNA, 只有dcas9-AIDx组EGFP+ %为5.2%, 而其他 组均为0。这一实验结果表明, 确实是AIDx与dCas9 的融合才使整个系统具有单核苷酸突变功能。

通过流式在蛋白水平检测EGFP+ %的水平来指 示单核苷酸突变频率, 这只是一种比较便捷的评估方 式, 更直接、精确的方法是通过高通量测序来检测单 核苷酸突变频率的高低。因此, 我们抽提细胞基因组 DNA, 通过PCR将目的基因EGFP加上接头序列, 通过 illumina高通量测序来检测单核苷酸突变频率。

单独转染AIDx会在EGFP整个基因上均匀产生 单核苷酸突变, 并且突变频率只有1%~2%, 与之前 的报道吻合[14] 。然而, 共转dCas9-AID和针对终止 密码子的4个sgRNA的报告细胞, 约20%的DNA分子 含有至少1个突变碱基; 并且这些突变主要集中在 EGFP基因中TAG终止密码子上下游150 bp。与AID 本身性质相似, 胞嘧啶和鸟嘌呤是dCas9-AID组的主 要突变碱基, 占总突变碱基的80%以上。

对sgRNA靶向区域进行具体分析, 无论是外源 性基因EGFP还是内源性基因AAVS1, dCas9-AIDx都 能使靶向区域超过50%的胞嘧啶和鸟嘌呤产生突变, 而AIDx只能使低于20%的碱基突变。更重要的是, 与AIDx对比, dCas9-AIDx使碱基突变频率得到10倍 提高, 靶点区域碱基突变频率提高到4×10–4 (次/碱基 /细胞周期), 这种效率相当于B细胞生发中心反应过 程中, 体细胞高频突变水平。由此可见, 外源表达的 dCas9-AIDx对胞嘧啶和鸟嘌呤具有高效编辑作用。

3 TAM引入多样化突变并且摆脱对AID 对一级序列的依赖性

根据AID的生化性质, AID将胞嘧啶(C)脱碱基 产生尿嘧啶(U)。因此, 如果在非B细胞内过表达 AID, 会产生C向T和G向A的碱基突变类型[10] 。令我 们感到惊喜的是, dCas9与AIDx融合之后, 碱基突变 方向更加多样化。dCas9-AIDx产生的单核苷酸突变方向更加均一化, 打破了原来的单一化格局, 更有利 产生多样均一的突变类型。

由这种现象对dCas9-AIDx的突变修饰路径提 出一种假设。AID作用于单链DNA的胞嘧啶(C)上, 使胞嘧啶脱氨基变成尿嘧啶(U)。随后U-G错配有两 种命运。第一种命运, 这种错配方式未被及时修复, 在DNA复制中被保留, 形成C-T和G-A的单核苷酸 突变。第二种命运, 错配碱基U被UNG切除, 形成无 嘧啶位点, 随后在无嘧啶位点处随机掺入A、T、C、 G等4种碱基。而dCas9-AIDx融合蛋白抑制第一条 路径, 从而使碱基突变方向更加多元化。碱基突变 方向的多样化, 更有利于产生不同的蛋白突变体, 用 于功能筛选。

除了能够使碱基突变方向多样化之外, dCas9- AIDx给我们的另外一个惊喜是, dCas9-AIDx使AIDx 摆脱对特定DNA一级序列的依赖性。AID发挥胞 嘧啶脱氨酶活性, 强烈依赖于特定的DNA一级序列, 具有活跃作用序列(A/T)GCN(N指任意碱基) [11] 。分 别统计AIDx和dCas9-AIDx诱导的突变碱基上下游 碱基组成, 令突变碱基C为第0位。AIDx具有活跃 作用序列(A/T)GCN(N指任意碱基), 而对于dCas9- AIDx组, 在突变碱基上游–1、–2位, 下游+1位, 4种 碱基均匀分布。因此, dCas9-AIDx除了具有高效的 单核苷酸突变能力和多样化的单核苷酸突变方向 外, 还摆脱了对DNA一级序列的要求。

4 UGI提高TAM效率, 固定其突变类型, 并揭示其在DNA上的作用轨迹

UGI(uracil glycosylase inhibitor)作为一种噬菌 体蛋白, 当噬菌体入侵大肠杆菌时, 可以保护自身的 基因组免受宿主UNG(uracil N-glycosylase)的修复, 因此, UGI是UNG的抑制剂, 使UNG无法将AID产生 的U切除, 无法完成下游修复[15] 。共转dCas9-AIDx、 UGI和单个sgRNA使单核苷酸突变效率得到10倍提 高。除此之外, 加入UGI后, 突变方向更加单一, 只 保留C-T和G-A突变。

UGI的使用更有利于我们揭示dCas9-AIDx的 作用轨迹。以PAM(protospacer adjacent motif)序列 中NGG中的N为0位。其上游为负(–), 下游为正(+), dCas9-AIDx主要在间隔序列区域造成突变, 而且 突变最高点是在PAM序列+12和+16位。因此利用 TAM的这一特点, 我们可以在DNA上产生特异的点突变。

5 碱基编辑新技术的应用

靶向性抗肿瘤药物, 直接特异性的抑制促癌 基因的活性, 是近几十年来肿瘤治疗的突破性进 展, 但随后的临床实践发现, 很多肿瘤都对靶向性 药物产生了耐药。其中, 编码靶点蛋白的DNA中 产生单核苷酸突变, 是肿瘤细胞对肿瘤药物产生耐 受性的重要原因[3] 。在慢性粒细胞白血病(chronic myelogenous leukemia, CML)的治疗中, 针对原癌基 因BCR-ABL位点的伊马替尼(Imatinib)药物, 是第一 个开发成功的靶向性药物。Imatinib可以和ATP竞 争, 与ABL(abelson murine leukemia viral oncogene homolog)激酶结合, 从而使ABL激酶处于低活性, 抑 制肿瘤的生长[16-17] 。但在病人样本中发现, 在ABL基 因的酪氨酸激酶活性结构域发生单核苷酸突变, 失 去结合Imatinib的能力, 产生耐药性。针对这些突 变, 制药公司开发或正在开发新一代的抑制剂, 以挽 救病人的生命。因此, 我们认为, 如果可以预测出 Imatinib的耐药性突变, 可以加快新药开发的速度, 造福更多的病人。

为筛选Imatinib耐药性位点, 针对ABL基因的 酪氨酸激酶活性结构域中编码ATP结合位点序列设 计sgRNA。在慢性髓样白血病细胞系K562(含BCRABL融合基因)中建立稳定表达dCas9-AIDx融合蛋 白的细胞系, 随后转染针对AAVS1或ABL激酶结构 域的sgRNA库。连续进行Imatinib药物处理2~3周 后, 阴性对照组(转染AAVS1 sgRNA或未感染任何sgRNA)细胞全部死亡, 而实验组细胞数目开始增长, 提示有一些细胞获得了耐药性。

收集获得耐药性细胞的RNA和基因组DNA后, 对ABL基因第6个外显子进行高通量测序。数据分 析表明, 约30%的DNA分子发生C944T, 即氨基酸发 生T315I突变。T315I是在CML病人中发现的第一个 耐药性位点。除此之外, 我们还发现6个新的有义突 变。在后续实验中, 我们进一步证明这些新突变位 点可以赋予K562耐药性, 并且细胞耐药性的强度跟 筛选过程中对应的单核苷酸突变频率成正比。以此 为例, 我们的结果表明, 利用TAM技术可以有效地 预测和筛选对抑制剂耐受的点突变, 为研究大分子– 小分子的相互作用和新的药物设计提供新的思路。

6 总结

与其他基因编辑方向相比, 靶向性激活诱导 的胞嘧啶脱氨酶(AID)介导的核苷酸突变(targeted AID-mediated mutagenesis, TAM)新技术具有独特的 功能: (1)在不存在UGI的情况下, 胞嘧啶可以随机 的向其他三个碱基转变; (2)dCas9-AID融合蛋白的 活性只依赖于sgRNA, 与AID的识别的一级序列无 关; (3)dCas9-AID可以同时诱导多个胞嘧啶的突变, 同时这一方法不依赖于DNA切割和修复, 可以大幅 提高单碱基精确编辑的效率, 避免了DNA的双链断 裂。因此作为遗传操作的新技术, TAM可以诱导功 能获得型的突变, 有着广泛的应用前景, 为分子进 化、基因治疗和在单碱基水平上分析基因调控元件 等领域提供新的方法(图2)。


dCas9-AID融合蛋白, 被sgRNA招募到相应的基因组DNA上, 随机诱导胞嘧啶和鸟嘌呤的点突变, 从而实现体内特定DNA序列的多样化, 通过遗 传筛选, 高通量分析单核苷酸突变的功能。
Guided by sgRNAs, dCas9-AID fusion protein is recruited to endogenous genomic loci to induce somatic hypermutation in designated DNA sequence. Subsequently through genetic screening are biological functions of SNVs characterized.
图2 利用dCas9-AID融合蛋白诱导基因组原位点突变的示意图
Fig.2 A carton showing to use dCas9-AID fusion protein to induce somatic hypermutation in mammalian cells


除了我们的研究外, 另一研究发现, dCas9-AID 融合蛋白结合MS2-MCP(MS2 coat protein)系统可以 有效编辑胞嘧啶, 产生多样化的突变类型, 并且编 辑窗口更加大, 在PAM上下游各50 bp[18] 。和我们的 发现类似, 另两项研究也先后发现, 在UGI存在的情 况下, nCas9(Cas9 D10A突变体)与不同类型的胞嘧 啶脱氨酶融合可以高效地诱导胞嘧啶向胸腺嘧啶转 变, 并且其活性只局限于间隔序列的特定碱基, 因 此可以实现高效率的单碱基精确编辑[19-20] 。这些研 究一起证明了靶向性的胞嘧啶脱氨酶作为基因编辑 工具的可行性和优势。后续的研究将进一步提高这 一系统的效率以及扩展突变的类型(如A/T碱基的修 饰)。

参考文献 (References)
1 Bell RJ, Rube HT, Kreig A, Mancini A, Fouse SD, Nagarajan RP, et al. Cancer. The transcription factor GABP selectively binds and activates the mutant TERT promoter in cancer. Science 2015; 348(6238): 1036-9.

2 Stephens PJ, Tarpey PS, Davies H, Van Loo P, Greenman C, Wedge DC, et al. The landscape of cancer genes and mutational processes in breast cancer. Nature 2012; 486(7403): 400-4

3 Daub H, Specht K, Ullrich A. Strategies to overcome resistance to targeted protein kinase inhibitors. Nat Rev Drug Discov 2004; 3(12): 1001-10.

4 Nachman MW, Crowell SL. Estimate of the mutation rate per nucleotide in humans. Genetics 2000; 156(1): 297-304

5 Takahasi KR, Sakuraba Y, Gondo Y. Mutational pattern and frequency of induced nucleotide changes in mouse ENU mutagenesis. BMC Mol Biol 2007; 8: 52

6 Hsu PD, Lander ES, Zhang F. Development and applications of CRISPR-Cas9 for genome engineering. Cell 2014; 157(6): 1262- 78

7 Doudna JA, Charpentier E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science 2014; 346(6213): 1258096

8 Mali P, Esvelt KM, Church GM. Cas9 as a versatile tool for engineering biology. Nat Methods 2013; 10(10): 957-63.

9 Cheng AW, Wang H, Yang H, Shi L, Katz Y, Theunissen TW, et al. Multiplexed activation of endogenous genes by CRISPR-on, an RNA-guided transcriptional activator system. Cell Res 2013; 23(10): 1163-71

10 Martin A, Bardwell PD, Woo CJ, Fan M, Shulman MJ, Scharff MD. Activation-induced cytidine deaminase turns on somatic hypermutation in hybridomas. Nature 2002; 415(6873): 802-6.

11 D?rner T, Foster SJ, Farner NL, Lipsky PE. Somatic hypermutation of human immunoglobulin heavy chain genes: Targeting of RGYW motifs on both DNA strands. Eur J Immunol 1998; 28(10): 3384-96.

12 Di Noia JM, Neuberger MS. Molecular mechanisms of antibody somatic hypermutation. Annu Rev Biochem 2007; 76: 1-22.

13 Peled JU, Kuang FL, Iglesias-Ussel MD, Roa S, Kalis SL, Goodman MF, et al. The biochemistry of somatic hypermutation. Annu Rev Immunol 2008; 26: 481-511

14 Yoshikawa K, Okazaki IM, Eto T, Kinoshita K, Muramatsu M, Nagaoka H, et al. AID enzyme-induced hypermutation in an actively transcribed gene in fibroblasts. Science 2002; 296(5575): 2033-6

15 Di Noia J, Neuberger MS. Altering the pathway of immunoglobulin hypermutation by inhibiting uracil-DNA glycosylase. Nature 2002; 419(6902): 43-8.

16 Nardi V, Azam M, Daley GQ. Mechanisms and implications of imatinib resistance mutations in BCR-ABL. Curr Opin Hematol 2004; 11(1): 35-43

17 Gambacorti-Passerini CB, Gunby RH, Piazza R, Galietta A, Rostagno R, Scapozza L. Molecular mechanisms of resistance to imatinib in Philadelphia-chromosome-positive leukaemias. Lancet Oncol 2003; 4(2): 75-85.

18 Nishida K, Arazoe T, Yachie N, Banno S, Kakimoto M, Tabata M, et al. Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems. Science 2016; 353(6305): doi: 10.1126/science.aaf8729.

19 Komor AC, Kim YB, Packer MS, Zuris JA, Liu DR. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 2016; 533(7603): 420-4

20 Nishida K, Arazoe T, Yachie N, Banno S, Kakimoto M, Tabata M, et al. Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems. Science 2016; 353(6305): doi: 10.1126/science.aaf8729.

此内容已有2758人浏览

您是第 位访问者,欢迎!
主 办:中国科学院上海生命科学研究院生物化学与细胞生物学研究所 中国细胞生物学学会
协办: 上海国联干细胞技术有限公司 上海赛傲生物技术有限公司
地 址:上海徐汇区岳阳路319号31号楼A楼303室 邮编:200031 电话:021-54920950 / 2892 / 2895 Email:cjcb@sibs.ac.cn
沪ICP备05017545号