作為目前最受歡迎的基因編輯工具,成簇規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)技術正在基礎生物學研究、醫學、生物技術等多個領域引起一場新的變革。該文先簡單介紹了 CRISPR-CRISPR 相關蛋白(CRISPR-associated protein,Cas)系統的發展歷史,然后重點介紹了 CRISPR 工具箱中經典的 CRISPR-Cas9 工具、后續的 CRISPR-FnCas9/RCas9 工具以及新興的 CRISPR-Cas13 和 CRISPR-Cas12a 工具,最后對這場技術革命背后值得思考的問題進行了評論。
引用本文: 肖婧, 張宗德. CRISPR 技術:一個新型基因編輯工具所引發的革命. 華西醫學, 2018, 33(8): 943-949. doi: 10.7507/1002-0179.201807080 復制
成簇規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)-CRISPR 相關蛋白(CRISPR-associated protein,Cas)系統是細菌和古生菌在長期演化過程中形成的抵御外來遺傳物質的一種獲得性免疫防御機制。2012 年,Jinek 等[1]、Gasiunas 等[2]首次體外證實 Cas9 蛋白能夠切割 DNA,標志著 CRISPR-Cas9 系統被正式開發為 RNA 引導的基因組編輯工具。近幾年,CRISPR-Cas9 技術得到飛速發展,應用范圍從最初的基因編輯到分子成像,非常廣泛。本文將對 CRISPR-Cas 系統的發展歷史、CRISPR 工具箱中幾種具有代表性的工具以及這場技術革命背后值得思考的問題進行介紹,以期為相關人員了解 CRISPR 技術提供參考。
1 CRISPR-Cas 系統的發展歷史
1987 年,來自于日本大阪大學的 Ishino 等[3]學者在大腸桿菌堿性磷酸酶基因附近發現了一段獨特的被非重復序列(即間隔序列)所間隔的“串聯重復序列”,當時人們并不清楚這些序列的生物學意義。2000 年,Mojica 等[4]發現這種特點的序列在>40% 的細菌中和>90% 的古生菌中廣泛存在。2002 年,Jansen 等[5]將此種特點的序列命名為“成簇規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)”。在這之前,研究者們主要關注的是 CRISPR 中的重復序列,但之后的研究證實 CRISPR 中插入的間隔序列才是具有重要生物學功能的關鍵要素。2005 年,3 個生物信息學團隊的研究者們發現 CRISPR 中的間隔序列與外源性質粒和細菌噬菌體同源,并推測 CRISPR 可能與細菌和古生菌的獲得性免疫相關[6-8]。Bolotin 等[8]在間隔序列前體的緊鄰處發現一段長為 2~5 bp 的保守序列,即前間隔序列毗鄰基序(protospacer-adjacent motif,PAM),宿主通過 PAM 序列來識別自己和非己序列[9]。CRISPR 系統的第一次突破性研究結果的取得是在 2007 年。Barrangou 等[10]發現抗噬菌體菌株獲得了與噬菌體基因組相匹配的間隔序列,從而利用實驗首次證實了 CRISPR 系統的獲得性免疫作用,并證實獲取的間隔序列與 CRISPR 相關基因(CRISPR-associated genes,cas)在對抗噬菌體的免疫過程中均發揮著重要的作用。
2008 年,研究者們闡述了 CRISPR-Cas 系統的作用機制。Brouns 等[11]發現間隔序列可以轉錄形成 CRISPR RNA(crRNA),成熟的 crRNA 具有指導 Cas 蛋白靶向性干擾外源性病毒增殖的作用。Marraffini 等[12]發現 CRISPR-Cas 系統的作用靶點是 DNA。由此,研究者們證實 CRISPR-Cas 系統的 2 個重要組分——crRNA 和 Cas 蛋白,二者在形成復合體后,crRNA 主要通過堿基互補配對的原則與入侵的靶序列結合,Cas 蛋白則發揮著對靶序列進行切割和降解的作用。2009 年,Hale 等[13]發現Ⅲ型-BCRISPR-Cas 系統還可以靶向性切割 RNA。2011 年,Deltcheva 等[14]發現Ⅱ型 CRISPR-Cas 系統中另一個重要組分反式編碼小 RNA(trans-encoded small RNA,tracrRNA),該分子指導 crRNA 分子的成熟,并與 crRNA 結合形成 tracrRNA/crRNA 二元復合體,指導 Cas9 蛋白在靶序列上進行定點剪切。Sapranauskas 等[15]則證實Ⅱ型 CRISPR-Cas 系統可以異源性地表達在其他物種,并可對入侵的核酸成功發揮干擾作用,另外還發現 Cas9 蛋白是此系統唯一必需蛋白。這兩個研究小組的研究成果為人們利用Ⅱ型 CRISPR-Cas 系統開發為全新的基因編輯工具奠定了理論基礎。
CRISPR-Cas 系統的第二次突破性研究結果的取得是在 2012 年,Jinek 及其同事率先在體外證實了 Cas9 蛋白可以與靶 DNA 特定位點結合并行使剪切作用[1-2]。至此,CRISPR-Cas9 系統被正式開發為 RNA 引導的基因組編輯工具,2012 年和 2013 年 CRISPR 技術連續 2 年被 Science 雜志評為年度十大科學突破之一,2015 年榮登該榜單榜首之位,2017 年 Science 雜志年度突破和 Nature 雜志年度人物也均授予了 CRISPR 相關技術——新型“堿基編輯器”[16]。
2 靶向 DNA 的 CRISPR-Cas9 系統
CRISPR-Cas9 系統由 5’端的 tracrRNA 基因、中間一系列的 Cas 蛋白編碼基因和 3’端的 CRISPR 陣列組成,后者由引導序列(具有啟動子的功能)、眾多的間隔序列和重復序列順序排列組成。天然狀態下,CRISPR-Cas9 系統保護細菌和古生菌免受外來質粒或噬菌體的入侵,其免疫過程主要分為 3 個階段:獲取、表達和干擾。獲取階段,當外源性基因首次入侵宿主菌時,細菌或古生菌通過 CRISPR-Cas9 系統識別入侵 DNA 中前間隔序列附近的 PAM 序列,利用 Cas1、Cas2 蛋白將前間隔序列加工成為新的重復-間隔序列整合到 CRISPR 簇內。表達階段,當外源基因再次入侵時,細菌轉錄重復-間隔序列形成 pre-crRNA,另外 cas 操縱子上游與 pre-crRNA 重復序列互補的 tracrRNA 也同時被轉錄,pre-crRNA 與 tracrRNA 結合形成雙鏈 RNA,在 Cas9 蛋白的協同下被核糖核酸內切酶(ribonuclease,RNase Ⅲ)加工處理為成熟的 crRNA。干擾階段,crRNA-tracrRNA-Cas9 蛋白復合體結合到與 crRNA 互補的靶基因上,Cas9 蛋白的兩個結構域(RuvC 和 HNH)各剪切 DNA 雙鏈中的一條鏈,引入雙鏈斷裂。
目前,產膿鏈球菌(Streptococcus pyogenes SF370)的Ⅱ型 CRISPR-Cas9 系統是改造最為成功的人工核酸內切酶(SpCas9)。Jinek 等[1]對Ⅱ型系統進行簡化,即將 crRNA 和 tracrRNA 融合成一條單鏈引導 RNA(single-guide RNA,sgRNA),從而體外切割 DNA 時不需要 RNase Ⅲ的處理,僅需 sgRNA 和 Cas9 蛋白即可。其中,sgRNA 通過 crRNA 與靶 DNA 的互補配對區結合,Cas9 蛋白行使剪切功能切割靶 DNA,靶 DNA 序列 3’末端的 PAM 序列(5’-NGG-3’)為 Cas9 的識別位點,宿主通過 PAM 序列來識別自己和非己序列。切割導致靶 DNA 雙鏈斷裂,斷裂之后宿主通過同源重組(homologous recombination,HR)或非同源末端連接(nonhomologous end joining,NHEJ)途徑修復發生雙鏈斷裂的 DNA。若利用的是 NHEJ 修復方式,則可在靶基因中引入插入/缺失突變導致移碼突變或無義突變,有效地破壞靶基因的開放閱讀框,導致基因失活(knockout);若利用的是 HR 修復方式,需人為提供含特定序列的修復模板,細胞即可按此模板修復斷裂 DNA,最終在靶基因上插入一段特定序列(knock in)、刪除特定序列(knock out)、引入特定突變堿基或序列,從而實現對靶基因的精確修飾。
2013 年,CRISPR-Cas 系統第一次被成功應用于真核細胞——人類細胞的基因編輯[17-20],之后該技術迅速在真核細胞領域內的多個物種上(包括線蟲、果蠅、酵母、斑馬魚、擬南芥、煙草、小鼠、大鼠、猴子等)實現了精確的基因修飾[21-28]。近幾年來,為了提高靶位點的特異性、降低脫靶效應及提高 CRISPR 基因編輯的效率,來自包括麻省理工學院張鋒課題組等多個機構的學者們或對 CRISPR-Cas9 系統進行改進或發展更為靈活可用的 CRISPR 衍生系統,包括利用 Cas9 切口酶[nCas9,兩個核酶區域(RuvC 和 HNH)之一發生點突變(D10A 或 H840A)]的雙切口策略[29]、FokI-dCas9(fCas9)融合策略[30-31]、導入小分子化合物[32]、應用化膿性金黃色葡萄球菌的 Cas9(SaCas9)[33]、應用工程化的 CRISPR-Cas9 核酸酶突變體[34]、應用改良“增強型”化膿性鏈球菌 Cas9(eSpCas9)[35]以及開發新型的納米金顆粒遞送系統遞送 CRISPR 系統[36]等。2017 年,David Liu 研究組構建出的新型“堿基編輯器”,能夠在人類和小鼠細胞系中以低出錯率永久及高效地將腺嘌呤(A)或胸腺嘧啶(T)轉化為胞嘧啶(C)或鳥嘌呤(G),這一修改單個 DNA 堿基且不隨機插入和刪除基因組的方法是 CRISPR 技術領域內又一重大突破[16]。
CRISPR 技術方面的改進及晶體結構的解析[37-38]促進了科學家們對人類及動物相關疾病的研究。2015 年 12 月 31 日《科學》雜志同時刊登了 3 篇研究人員利用 CRISPR 技術治療小鼠假性肥大型肌肉萎縮癥的研究,這是 CRISPR 技術首次成功地用于治療成年哺乳動物體內的基因疾病,為未來治療人類相關疾病帶來了希望[39-41]。近幾年來,CRISPR 技術已經廣泛應用于人類多種疾病的治療研究中,比如 2015 年中國科學家利用 CRISPR 技術對醫院廢棄的不能存活的胚胎完成了首次人類胚胎中導致 β 型地中海貧血的基因修復,引發了全球科學界和社會對倫理學的爭議[42];2018 年,有研究者利用 CRISPR 技術與嵌合抗原受體 T 細胞免疫療法(chimeric antigen receptor T-cell immunotherapy,CAR T 細胞療法)聯合治療急性髓系白血病取得了比單獨 CAR T 細胞療法更好的治療效果[43];還有研究者利用 CRISPR 技術編輯血紅細胞,生產出了具有廣泛輸血相容性的功能紅細胞,為將來稀有血型患者借助這種人工基因編輯細胞進行輸血創造了希望[44]。
3 靶向 RNA 的 CRISPR-Cas 系統
3.1 CRISPR-FnCas9 和 CRISPR-RCas9 系統
Ⅲ型-BCRISPR-Cas 系統是第一個被發現靶向切割 RNA 的型別[13]。2013 年,有研究證實,來自于新兇手弗朗西絲菌(Francisella novicida)的Ⅱ型-B Cas9 酶(FnCas9)在天然狀態下也可以靶向該菌的 mRNA,但不是通過剪切 mRNA 的方式,而是通過結合到 mRNA 起始密碼子上從而抑制 FTN_1103 細菌脂蛋白的表達,最終實現細菌感染宿主過程中的免疫逃逸[45]。盡管此種沉默機制仍然不明,2015 年,上述研究小組與另一個從事人類丙型肝炎病毒的研究小組合作,利用 FnCas9 酶結合人類丙型肝炎病毒的 RNA,阻止了該病毒在人類細胞中進行復制,這是首次利用 CRISPR-Cas9 系統靶向人類細胞中 RNA 的研究[46]。但這種 FnCas9 蛋白可對細胞核的 DNA 進行攻擊,即脫靶效應的存在限制了該蛋白的應用。
除了上述所說的某些 Cas9 在天然情況下具有靶向 RNA 的能力,2014 年,O’Connell 等[47]通過重新改造產膿鏈球菌的 Cas9(SpCas9),實現了 RNA 的體外切割。該研究通過外源性提供一段含 PAM 序列的 ssDNA 寡核苷酸鏈(稱為 PAMmers),該 PAMmers 序列可與靶 RNA 互補結合,SpCas9 在 crRNA 的協同作用下識別該 PAM 序列、最終切割靶 RNA,作者將這一靶向 RNA 的 CRISPR/Cas9 復合物命名為 RCas9。目前該 CRISPR-RCas9 系統存在一些缺點,包括 SpCas9、PAMmers 和引導 RNA(guide RNA,gRNA)等組分轉入細胞的有效性問題、PAMmers 序列的易降解性以及脫靶效應等問題,造成了該系統的應用受限。
3.2 CRISPR-Cas13 系統
2016 年,Abudayyeh 等[48]首次發現,來自纖毛菌(Leptotrichia shahii)的Ⅵ型-ACas13a (LshCas13a)蛋白(之前被命名為 C2c2 蛋白)能夠切割細菌細胞中的特定 RNA 序列,且該蛋白在切割靶 RNA 之后仍保持活性,即可以繼續切割其他的非靶 RNA(附帶切割活性)。Cas13a 蛋白是研究者們鑒定出的首個自然發生的只靶向于 RNA 的 CRISPR 系統,該蛋白在天然狀態下有助于保護細菌免受病毒的感染。Cas13a 蛋白的這種只靶向作用于 RNA 的切割特性及其附帶切割活性,是其與 Cas9 和 Cas12a 蛋白的不同之處,該蛋白的發現有助于研究者們以高通量地方式更加特異性地操縱 RNA,標志著CRISPR工具箱中又增加了一個重要的工具。
此外,研究者們還利用源自不同細菌的 Cas13a 蛋白比如源自毛螺科菌(Lachnospiraceae bacterium)和口腔纖毛菌(Leptotrichia buccalis)的 Cas13a(分別簡稱為 LbaCas13a 和 LbuCas13a)蛋白,對蛋白的晶體結構和作用機制進行了解析和闡述[49-50]。另外,研究者們還致力于開發 Cas13a 家族的其他同系物,以為將來多元化地使用這些蛋白酶并擴展該技術的使用范圍奠定基礎[51]。2017 年,Abudayyeh 等[52]發現,來自纖毛菌(Leptotrichia wadei)的 Cas13a(LwaCas13a)蛋白比之前的 LshCas13a 蛋白具有更高的切割活性和特異性,并且系統的組分更簡單,更適于作為 RNA 編輯的工具,目前已經受到越來越多研究者的關注,且該研究首次利用 LwaCas13a 蛋白和多個 crRNA 在真核細胞中實現了對靶單鏈 RNA 的多位點打靶。目前,研究者們已經將這個只靶向 RNA 的 CRISPR 相關酶(即 Cas13a 蛋白)改造為一種經濟快速且靈敏度高的診斷工具,這種技術日后將會在應對病毒性或細菌性流行病的暴發以及監控抗生素耐藥性和檢測癌癥方面具有巨大的應用潛力[53]。
另外,Smargon 等[54]還發現了另一種同樣具有靶向和編輯 RNA 的能力的蛋白—— Cas13b 蛋白,該蛋白的作用機制與 Cas13a 蛋白基本相同,但更適用于微調基因功能。2018 年,研究者發現了與其他 Cas13 酶的功能類似但分子質量更小的 Cas13d 蛋白,該蛋白比其他 Cas13a-c 酶小 20%,比 Cas9 小 33%,更容易包裝到容量較小的載體中[55-56]。鑒于 DNA 編輯會造成細胞基因組永久性的改變,近兩年 Cas13 酶以其敲低 RNA 而不改變基因組的特性成為 CRISPR 技術中研究的熱點,而且相比 RNA 干擾技術該酶具有更強的特異性和功能,Cas13 同源物已經成為 CRISPR 工具箱中一個重要的新增工具。
4 同時靶向 DNA 和 RNA 的 CRISPR-Cas12a 系統
Cas12a(之前被命名為 Cpf1 蛋白),其分子質量小于 Cas9 蛋白,最早是研究者于 2015 年從新兇手弗朗西絲菌(Francisella novicida)U112 中鑒別出來的,屬于Ⅴ型-A 系統[57]。該系統 crRNA 的成熟不需要 tracrRNA,Cpf1-crRNA 復合物切割靶 DNA 產生的切口為黏性末端,這種交錯切割產物與Ⅱ型系統 Cas9 蛋白平末端相比,更有利于研究者進行基因的精確編輯。與 Cas9 蛋白僅具有 DNA 內切酶活性不同的是,Cas12a 蛋白同時具有 DNA 和 RNA 內切酶的活性,另外該蛋白發揮切割活性的兩個結構域為 RuvC 和 Nuc。與 Cas9 蛋白通過前間隔序列 3’端的 PAM 序列進行序列的識別不同的是,Cas12a 蛋白則是通過前間隔序列 5’端的 PAM 序列。其中,Cas9 蛋白偏好富含 G 的 PAM 序列(5’-NGG-3’),而 Cas12a 蛋白則偏好富含 T 的 PAM 序列(5’-YTN-3’和 5’-TTTN-3’)[57]。另外,由于 Cas12a 蛋白的切割位點遠離識別位點,如果切割位點的靶基因發生突變,研究者仍然可以有機會進行再度切割以校正編輯。
上述 Cas12a 蛋白的這些與 Cas9 蛋白不同的基因編輯特點,使其成為可與 Cas9 蛋白互補的新型基因編輯工具。另外,Cas12a 蛋白在 PAM 限制性、切割特性和特異性等方面表現的優勢,使得該系統更適合進行多基因編輯和精確基因編輯。目前,研究者們主要將 Cas12a 蛋白應用于靶向切割細胞中的 DNA。在細菌學和植物學領域,已有包括藍細菌[58]、谷氨酸棒桿菌[59]、大腸桿菌[60]、鼠疫耶氏菌[60]和恥垢分枝桿菌[60]等研究,以及大豆[61]、煙草[61]、水稻[62-63]和玉米[64]等研究的陸續出現。另外在真核細胞和哺乳動物中,Cas12a 系統的應用為研究者們盡早實現 CRISPR 基因編輯技術應用于人類疾病奠定了技術基礎[65-66]。2018 年,來自中國的學者開發了基于 CRISPR/Cas12a 的增強型堿基編輯器 [67],比之前 David Liu 研究組所構建的基于 CRISPR/Cas9 的新型堿基編輯器[16]具有更高的精度和更高的編輯效率。Zetsche 等[68]首次利用 CRISPR-Cas12a 系統在人類細胞和杜氏肌營養不良小鼠模型中實現了高效的基因修復,該研究顯示其同源重組修復效率可達 50%,突變基因被修復的小鼠未出現肌肉萎縮方面相關的病癥。目前,除了前面提到的 Cas13a 蛋白已被改造為快速、高靈敏度的診斷工具,該論文的研究者們又推出了以 Cas13/Csm6 和 Cas12a/Csm6 為代表的超級檢測系統,該系統可允許更多的檢測項目同時進行,底物的檢測濃度更低、靈敏度更強且操作系統更為簡單[69]。同時,另一研究團隊也基于 Cas12a 蛋白開發了新型核酸突變檢測技術,該系統可對體液中含有的少量 DNA 進行快速簡單的即時分析,同樣具有超高靈敏度[70]。
5 這場技術革命背后的思考
近年來,CRISPR-Cas9 這一被稱為“魔剪”的基因編輯工具,正在給整個科研界帶來革命性的變化。該技術利用 CRISPR 系統的原理,將外源性 Cas9 蛋白和引導 RNA 導入細胞內,利用 NHEJ 修復途徑即可實現對靶基因的敲除;如果同時導入模板 DNA,利用 HR 修復途徑即可實現對靶基因的精確修飾。隨著該技術的飛速發展,它已經在治愈癌癥、貧血、自閉癥、精神分裂癥和失明等眾多疾病方面顯示出了巨大的潛力。但是脫靶效應這一問題一直影響著 CRISPR-Cas9 系統的應用。
2017 年 5 月,Schaefer 等[71]發現在全基因組測序中,CRISPR-Cas9 編輯技術可使小鼠產生上千個非目標基因的突變,該研究結果引發了全球范圍內對 CRISPR 技術安全性的探討;但是,其他多數學者還是認為 CRISPR 技術的脫靶問題并沒有 Schaefer 等[71]認為得那么嚴重。2018 年 3 月,該論文由于方法和邏輯上存在缺陷被《Nature Methods》雜志予以撤稿。但是這一論文的研究結果仍然提醒我們在應用 CRISPR-Cas9 技術時要謹慎考慮該技術的脫靶效應。目前,許多研究者致力于減少 CRISPR 技術脫靶效應的研究,比如利用 Cas9 抑制劑防止 Cas9 蛋白在靶向切割后對其他非靶位點進行切割[72]、利用靶向 RNA 的 CRISPR 系統以避免直接對基因組 DNA 進行編輯或者利用特異性更強的 Cas 蛋白比如 Cas12a。現在,研究者可通過計算機模擬預測與無偏差檢測、體外全基因組檢測及基于細胞的全基因組檢測等方式檢測 CRISPR 脫靶突變,考慮到計算機預測的局限性、測序的成本及不同研究本身的特點不同,研究者可選擇最適合的方法或者組合方法檢測 CRISPR 脫靶突變。將來,商業化 CRISPR 脫靶突變檢測方法的發展必然可以促進脫靶檢測的廣泛應用,為改進 CRISPR 技術在人類疾病中應用的安全性鋪平道路。
2018 年 7 月,Ihry 等[73]發現 CRISPR 基因療法可能會增加致癌風險。研究者們在實驗室條件下利用 CRISPR-Cas9 技術剪切 DNA 時發現,該技術會導致細胞中 p53 的激活并引起基因編輯效率的降低;因此,p53 缺乏或不能被激活的細胞會顯示出更好的基因編輯效果,從而更有可能被挑選出來進行后續實驗;如果將此種抑癌基因表達缺乏的細胞移植入患者體內,可能會導致細胞增殖失控和癌變。但也有專家認為,p53 缺陷的細胞更容易被編輯并不一定意味著編輯后細胞更容易出現 p53 的缺陷,目前還無法證實 CRISPR 有致癌風險。另外,當需要實現大片段敲入、條件性敲除及點突變等較為復雜的基因修飾時,由于存在同源重組效率低的問題,CRISPR 技術的應用受到限制。
總之,研究者們在充分利用 CRISPR 技術眾多優勢的同時,需要清晰地認識到這場技術革命背后存在的問題。但是正是由于這些問題的存在,更加推動了該技術的完善和發展,將來 CRISPR 基因編輯技術必將被更廣泛地應用于臨床疾病的治療。
成簇規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)-CRISPR 相關蛋白(CRISPR-associated protein,Cas)系統是細菌和古生菌在長期演化過程中形成的抵御外來遺傳物質的一種獲得性免疫防御機制。2012 年,Jinek 等[1]、Gasiunas 等[2]首次體外證實 Cas9 蛋白能夠切割 DNA,標志著 CRISPR-Cas9 系統被正式開發為 RNA 引導的基因組編輯工具。近幾年,CRISPR-Cas9 技術得到飛速發展,應用范圍從最初的基因編輯到分子成像,非常廣泛。本文將對 CRISPR-Cas 系統的發展歷史、CRISPR 工具箱中幾種具有代表性的工具以及這場技術革命背后值得思考的問題進行介紹,以期為相關人員了解 CRISPR 技術提供參考。
1 CRISPR-Cas 系統的發展歷史
1987 年,來自于日本大阪大學的 Ishino 等[3]學者在大腸桿菌堿性磷酸酶基因附近發現了一段獨特的被非重復序列(即間隔序列)所間隔的“串聯重復序列”,當時人們并不清楚這些序列的生物學意義。2000 年,Mojica 等[4]發現這種特點的序列在>40% 的細菌中和>90% 的古生菌中廣泛存在。2002 年,Jansen 等[5]將此種特點的序列命名為“成簇規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)”。在這之前,研究者們主要關注的是 CRISPR 中的重復序列,但之后的研究證實 CRISPR 中插入的間隔序列才是具有重要生物學功能的關鍵要素。2005 年,3 個生物信息學團隊的研究者們發現 CRISPR 中的間隔序列與外源性質粒和細菌噬菌體同源,并推測 CRISPR 可能與細菌和古生菌的獲得性免疫相關[6-8]。Bolotin 等[8]在間隔序列前體的緊鄰處發現一段長為 2~5 bp 的保守序列,即前間隔序列毗鄰基序(protospacer-adjacent motif,PAM),宿主通過 PAM 序列來識別自己和非己序列[9]。CRISPR 系統的第一次突破性研究結果的取得是在 2007 年。Barrangou 等[10]發現抗噬菌體菌株獲得了與噬菌體基因組相匹配的間隔序列,從而利用實驗首次證實了 CRISPR 系統的獲得性免疫作用,并證實獲取的間隔序列與 CRISPR 相關基因(CRISPR-associated genes,cas)在對抗噬菌體的免疫過程中均發揮著重要的作用。
2008 年,研究者們闡述了 CRISPR-Cas 系統的作用機制。Brouns 等[11]發現間隔序列可以轉錄形成 CRISPR RNA(crRNA),成熟的 crRNA 具有指導 Cas 蛋白靶向性干擾外源性病毒增殖的作用。Marraffini 等[12]發現 CRISPR-Cas 系統的作用靶點是 DNA。由此,研究者們證實 CRISPR-Cas 系統的 2 個重要組分——crRNA 和 Cas 蛋白,二者在形成復合體后,crRNA 主要通過堿基互補配對的原則與入侵的靶序列結合,Cas 蛋白則發揮著對靶序列進行切割和降解的作用。2009 年,Hale 等[13]發現Ⅲ型-BCRISPR-Cas 系統還可以靶向性切割 RNA。2011 年,Deltcheva 等[14]發現Ⅱ型 CRISPR-Cas 系統中另一個重要組分反式編碼小 RNA(trans-encoded small RNA,tracrRNA),該分子指導 crRNA 分子的成熟,并與 crRNA 結合形成 tracrRNA/crRNA 二元復合體,指導 Cas9 蛋白在靶序列上進行定點剪切。Sapranauskas 等[15]則證實Ⅱ型 CRISPR-Cas 系統可以異源性地表達在其他物種,并可對入侵的核酸成功發揮干擾作用,另外還發現 Cas9 蛋白是此系統唯一必需蛋白。這兩個研究小組的研究成果為人們利用Ⅱ型 CRISPR-Cas 系統開發為全新的基因編輯工具奠定了理論基礎。
CRISPR-Cas 系統的第二次突破性研究結果的取得是在 2012 年,Jinek 及其同事率先在體外證實了 Cas9 蛋白可以與靶 DNA 特定位點結合并行使剪切作用[1-2]。至此,CRISPR-Cas9 系統被正式開發為 RNA 引導的基因組編輯工具,2012 年和 2013 年 CRISPR 技術連續 2 年被 Science 雜志評為年度十大科學突破之一,2015 年榮登該榜單榜首之位,2017 年 Science 雜志年度突破和 Nature 雜志年度人物也均授予了 CRISPR 相關技術——新型“堿基編輯器”[16]。
2 靶向 DNA 的 CRISPR-Cas9 系統
CRISPR-Cas9 系統由 5’端的 tracrRNA 基因、中間一系列的 Cas 蛋白編碼基因和 3’端的 CRISPR 陣列組成,后者由引導序列(具有啟動子的功能)、眾多的間隔序列和重復序列順序排列組成。天然狀態下,CRISPR-Cas9 系統保護細菌和古生菌免受外來質粒或噬菌體的入侵,其免疫過程主要分為 3 個階段:獲取、表達和干擾。獲取階段,當外源性基因首次入侵宿主菌時,細菌或古生菌通過 CRISPR-Cas9 系統識別入侵 DNA 中前間隔序列附近的 PAM 序列,利用 Cas1、Cas2 蛋白將前間隔序列加工成為新的重復-間隔序列整合到 CRISPR 簇內。表達階段,當外源基因再次入侵時,細菌轉錄重復-間隔序列形成 pre-crRNA,另外 cas 操縱子上游與 pre-crRNA 重復序列互補的 tracrRNA 也同時被轉錄,pre-crRNA 與 tracrRNA 結合形成雙鏈 RNA,在 Cas9 蛋白的協同下被核糖核酸內切酶(ribonuclease,RNase Ⅲ)加工處理為成熟的 crRNA。干擾階段,crRNA-tracrRNA-Cas9 蛋白復合體結合到與 crRNA 互補的靶基因上,Cas9 蛋白的兩個結構域(RuvC 和 HNH)各剪切 DNA 雙鏈中的一條鏈,引入雙鏈斷裂。
目前,產膿鏈球菌(Streptococcus pyogenes SF370)的Ⅱ型 CRISPR-Cas9 系統是改造最為成功的人工核酸內切酶(SpCas9)。Jinek 等[1]對Ⅱ型系統進行簡化,即將 crRNA 和 tracrRNA 融合成一條單鏈引導 RNA(single-guide RNA,sgRNA),從而體外切割 DNA 時不需要 RNase Ⅲ的處理,僅需 sgRNA 和 Cas9 蛋白即可。其中,sgRNA 通過 crRNA 與靶 DNA 的互補配對區結合,Cas9 蛋白行使剪切功能切割靶 DNA,靶 DNA 序列 3’末端的 PAM 序列(5’-NGG-3’)為 Cas9 的識別位點,宿主通過 PAM 序列來識別自己和非己序列。切割導致靶 DNA 雙鏈斷裂,斷裂之后宿主通過同源重組(homologous recombination,HR)或非同源末端連接(nonhomologous end joining,NHEJ)途徑修復發生雙鏈斷裂的 DNA。若利用的是 NHEJ 修復方式,則可在靶基因中引入插入/缺失突變導致移碼突變或無義突變,有效地破壞靶基因的開放閱讀框,導致基因失活(knockout);若利用的是 HR 修復方式,需人為提供含特定序列的修復模板,細胞即可按此模板修復斷裂 DNA,最終在靶基因上插入一段特定序列(knock in)、刪除特定序列(knock out)、引入特定突變堿基或序列,從而實現對靶基因的精確修飾。
2013 年,CRISPR-Cas 系統第一次被成功應用于真核細胞——人類細胞的基因編輯[17-20],之后該技術迅速在真核細胞領域內的多個物種上(包括線蟲、果蠅、酵母、斑馬魚、擬南芥、煙草、小鼠、大鼠、猴子等)實現了精確的基因修飾[21-28]。近幾年來,為了提高靶位點的特異性、降低脫靶效應及提高 CRISPR 基因編輯的效率,來自包括麻省理工學院張鋒課題組等多個機構的學者們或對 CRISPR-Cas9 系統進行改進或發展更為靈活可用的 CRISPR 衍生系統,包括利用 Cas9 切口酶[nCas9,兩個核酶區域(RuvC 和 HNH)之一發生點突變(D10A 或 H840A)]的雙切口策略[29]、FokI-dCas9(fCas9)融合策略[30-31]、導入小分子化合物[32]、應用化膿性金黃色葡萄球菌的 Cas9(SaCas9)[33]、應用工程化的 CRISPR-Cas9 核酸酶突變體[34]、應用改良“增強型”化膿性鏈球菌 Cas9(eSpCas9)[35]以及開發新型的納米金顆粒遞送系統遞送 CRISPR 系統[36]等。2017 年,David Liu 研究組構建出的新型“堿基編輯器”,能夠在人類和小鼠細胞系中以低出錯率永久及高效地將腺嘌呤(A)或胸腺嘧啶(T)轉化為胞嘧啶(C)或鳥嘌呤(G),這一修改單個 DNA 堿基且不隨機插入和刪除基因組的方法是 CRISPR 技術領域內又一重大突破[16]。
CRISPR 技術方面的改進及晶體結構的解析[37-38]促進了科學家們對人類及動物相關疾病的研究。2015 年 12 月 31 日《科學》雜志同時刊登了 3 篇研究人員利用 CRISPR 技術治療小鼠假性肥大型肌肉萎縮癥的研究,這是 CRISPR 技術首次成功地用于治療成年哺乳動物體內的基因疾病,為未來治療人類相關疾病帶來了希望[39-41]。近幾年來,CRISPR 技術已經廣泛應用于人類多種疾病的治療研究中,比如 2015 年中國科學家利用 CRISPR 技術對醫院廢棄的不能存活的胚胎完成了首次人類胚胎中導致 β 型地中海貧血的基因修復,引發了全球科學界和社會對倫理學的爭議[42];2018 年,有研究者利用 CRISPR 技術與嵌合抗原受體 T 細胞免疫療法(chimeric antigen receptor T-cell immunotherapy,CAR T 細胞療法)聯合治療急性髓系白血病取得了比單獨 CAR T 細胞療法更好的治療效果[43];還有研究者利用 CRISPR 技術編輯血紅細胞,生產出了具有廣泛輸血相容性的功能紅細胞,為將來稀有血型患者借助這種人工基因編輯細胞進行輸血創造了希望[44]。
3 靶向 RNA 的 CRISPR-Cas 系統
3.1 CRISPR-FnCas9 和 CRISPR-RCas9 系統
Ⅲ型-BCRISPR-Cas 系統是第一個被發現靶向切割 RNA 的型別[13]。2013 年,有研究證實,來自于新兇手弗朗西絲菌(Francisella novicida)的Ⅱ型-B Cas9 酶(FnCas9)在天然狀態下也可以靶向該菌的 mRNA,但不是通過剪切 mRNA 的方式,而是通過結合到 mRNA 起始密碼子上從而抑制 FTN_1103 細菌脂蛋白的表達,最終實現細菌感染宿主過程中的免疫逃逸[45]。盡管此種沉默機制仍然不明,2015 年,上述研究小組與另一個從事人類丙型肝炎病毒的研究小組合作,利用 FnCas9 酶結合人類丙型肝炎病毒的 RNA,阻止了該病毒在人類細胞中進行復制,這是首次利用 CRISPR-Cas9 系統靶向人類細胞中 RNA 的研究[46]。但這種 FnCas9 蛋白可對細胞核的 DNA 進行攻擊,即脫靶效應的存在限制了該蛋白的應用。
除了上述所說的某些 Cas9 在天然情況下具有靶向 RNA 的能力,2014 年,O’Connell 等[47]通過重新改造產膿鏈球菌的 Cas9(SpCas9),實現了 RNA 的體外切割。該研究通過外源性提供一段含 PAM 序列的 ssDNA 寡核苷酸鏈(稱為 PAMmers),該 PAMmers 序列可與靶 RNA 互補結合,SpCas9 在 crRNA 的協同作用下識別該 PAM 序列、最終切割靶 RNA,作者將這一靶向 RNA 的 CRISPR/Cas9 復合物命名為 RCas9。目前該 CRISPR-RCas9 系統存在一些缺點,包括 SpCas9、PAMmers 和引導 RNA(guide RNA,gRNA)等組分轉入細胞的有效性問題、PAMmers 序列的易降解性以及脫靶效應等問題,造成了該系統的應用受限。
3.2 CRISPR-Cas13 系統
2016 年,Abudayyeh 等[48]首次發現,來自纖毛菌(Leptotrichia shahii)的Ⅵ型-ACas13a (LshCas13a)蛋白(之前被命名為 C2c2 蛋白)能夠切割細菌細胞中的特定 RNA 序列,且該蛋白在切割靶 RNA 之后仍保持活性,即可以繼續切割其他的非靶 RNA(附帶切割活性)。Cas13a 蛋白是研究者們鑒定出的首個自然發生的只靶向于 RNA 的 CRISPR 系統,該蛋白在天然狀態下有助于保護細菌免受病毒的感染。Cas13a 蛋白的這種只靶向作用于 RNA 的切割特性及其附帶切割活性,是其與 Cas9 和 Cas12a 蛋白的不同之處,該蛋白的發現有助于研究者們以高通量地方式更加特異性地操縱 RNA,標志著CRISPR工具箱中又增加了一個重要的工具。
此外,研究者們還利用源自不同細菌的 Cas13a 蛋白比如源自毛螺科菌(Lachnospiraceae bacterium)和口腔纖毛菌(Leptotrichia buccalis)的 Cas13a(分別簡稱為 LbaCas13a 和 LbuCas13a)蛋白,對蛋白的晶體結構和作用機制進行了解析和闡述[49-50]。另外,研究者們還致力于開發 Cas13a 家族的其他同系物,以為將來多元化地使用這些蛋白酶并擴展該技術的使用范圍奠定基礎[51]。2017 年,Abudayyeh 等[52]發現,來自纖毛菌(Leptotrichia wadei)的 Cas13a(LwaCas13a)蛋白比之前的 LshCas13a 蛋白具有更高的切割活性和特異性,并且系統的組分更簡單,更適于作為 RNA 編輯的工具,目前已經受到越來越多研究者的關注,且該研究首次利用 LwaCas13a 蛋白和多個 crRNA 在真核細胞中實現了對靶單鏈 RNA 的多位點打靶。目前,研究者們已經將這個只靶向 RNA 的 CRISPR 相關酶(即 Cas13a 蛋白)改造為一種經濟快速且靈敏度高的診斷工具,這種技術日后將會在應對病毒性或細菌性流行病的暴發以及監控抗生素耐藥性和檢測癌癥方面具有巨大的應用潛力[53]。
另外,Smargon 等[54]還發現了另一種同樣具有靶向和編輯 RNA 的能力的蛋白—— Cas13b 蛋白,該蛋白的作用機制與 Cas13a 蛋白基本相同,但更適用于微調基因功能。2018 年,研究者發現了與其他 Cas13 酶的功能類似但分子質量更小的 Cas13d 蛋白,該蛋白比其他 Cas13a-c 酶小 20%,比 Cas9 小 33%,更容易包裝到容量較小的載體中[55-56]。鑒于 DNA 編輯會造成細胞基因組永久性的改變,近兩年 Cas13 酶以其敲低 RNA 而不改變基因組的特性成為 CRISPR 技術中研究的熱點,而且相比 RNA 干擾技術該酶具有更強的特異性和功能,Cas13 同源物已經成為 CRISPR 工具箱中一個重要的新增工具。
4 同時靶向 DNA 和 RNA 的 CRISPR-Cas12a 系統
Cas12a(之前被命名為 Cpf1 蛋白),其分子質量小于 Cas9 蛋白,最早是研究者于 2015 年從新兇手弗朗西絲菌(Francisella novicida)U112 中鑒別出來的,屬于Ⅴ型-A 系統[57]。該系統 crRNA 的成熟不需要 tracrRNA,Cpf1-crRNA 復合物切割靶 DNA 產生的切口為黏性末端,這種交錯切割產物與Ⅱ型系統 Cas9 蛋白平末端相比,更有利于研究者進行基因的精確編輯。與 Cas9 蛋白僅具有 DNA 內切酶活性不同的是,Cas12a 蛋白同時具有 DNA 和 RNA 內切酶的活性,另外該蛋白發揮切割活性的兩個結構域為 RuvC 和 Nuc。與 Cas9 蛋白通過前間隔序列 3’端的 PAM 序列進行序列的識別不同的是,Cas12a 蛋白則是通過前間隔序列 5’端的 PAM 序列。其中,Cas9 蛋白偏好富含 G 的 PAM 序列(5’-NGG-3’),而 Cas12a 蛋白則偏好富含 T 的 PAM 序列(5’-YTN-3’和 5’-TTTN-3’)[57]。另外,由于 Cas12a 蛋白的切割位點遠離識別位點,如果切割位點的靶基因發生突變,研究者仍然可以有機會進行再度切割以校正編輯。
上述 Cas12a 蛋白的這些與 Cas9 蛋白不同的基因編輯特點,使其成為可與 Cas9 蛋白互補的新型基因編輯工具。另外,Cas12a 蛋白在 PAM 限制性、切割特性和特異性等方面表現的優勢,使得該系統更適合進行多基因編輯和精確基因編輯。目前,研究者們主要將 Cas12a 蛋白應用于靶向切割細胞中的 DNA。在細菌學和植物學領域,已有包括藍細菌[58]、谷氨酸棒桿菌[59]、大腸桿菌[60]、鼠疫耶氏菌[60]和恥垢分枝桿菌[60]等研究,以及大豆[61]、煙草[61]、水稻[62-63]和玉米[64]等研究的陸續出現。另外在真核細胞和哺乳動物中,Cas12a 系統的應用為研究者們盡早實現 CRISPR 基因編輯技術應用于人類疾病奠定了技術基礎[65-66]。2018 年,來自中國的學者開發了基于 CRISPR/Cas12a 的增強型堿基編輯器 [67],比之前 David Liu 研究組所構建的基于 CRISPR/Cas9 的新型堿基編輯器[16]具有更高的精度和更高的編輯效率。Zetsche 等[68]首次利用 CRISPR-Cas12a 系統在人類細胞和杜氏肌營養不良小鼠模型中實現了高效的基因修復,該研究顯示其同源重組修復效率可達 50%,突變基因被修復的小鼠未出現肌肉萎縮方面相關的病癥。目前,除了前面提到的 Cas13a 蛋白已被改造為快速、高靈敏度的診斷工具,該論文的研究者們又推出了以 Cas13/Csm6 和 Cas12a/Csm6 為代表的超級檢測系統,該系統可允許更多的檢測項目同時進行,底物的檢測濃度更低、靈敏度更強且操作系統更為簡單[69]。同時,另一研究團隊也基于 Cas12a 蛋白開發了新型核酸突變檢測技術,該系統可對體液中含有的少量 DNA 進行快速簡單的即時分析,同樣具有超高靈敏度[70]。
5 這場技術革命背后的思考
近年來,CRISPR-Cas9 這一被稱為“魔剪”的基因編輯工具,正在給整個科研界帶來革命性的變化。該技術利用 CRISPR 系統的原理,將外源性 Cas9 蛋白和引導 RNA 導入細胞內,利用 NHEJ 修復途徑即可實現對靶基因的敲除;如果同時導入模板 DNA,利用 HR 修復途徑即可實現對靶基因的精確修飾。隨著該技術的飛速發展,它已經在治愈癌癥、貧血、自閉癥、精神分裂癥和失明等眾多疾病方面顯示出了巨大的潛力。但是脫靶效應這一問題一直影響著 CRISPR-Cas9 系統的應用。
2017 年 5 月,Schaefer 等[71]發現在全基因組測序中,CRISPR-Cas9 編輯技術可使小鼠產生上千個非目標基因的突變,該研究結果引發了全球范圍內對 CRISPR 技術安全性的探討;但是,其他多數學者還是認為 CRISPR 技術的脫靶問題并沒有 Schaefer 等[71]認為得那么嚴重。2018 年 3 月,該論文由于方法和邏輯上存在缺陷被《Nature Methods》雜志予以撤稿。但是這一論文的研究結果仍然提醒我們在應用 CRISPR-Cas9 技術時要謹慎考慮該技術的脫靶效應。目前,許多研究者致力于減少 CRISPR 技術脫靶效應的研究,比如利用 Cas9 抑制劑防止 Cas9 蛋白在靶向切割后對其他非靶位點進行切割[72]、利用靶向 RNA 的 CRISPR 系統以避免直接對基因組 DNA 進行編輯或者利用特異性更強的 Cas 蛋白比如 Cas12a。現在,研究者可通過計算機模擬預測與無偏差檢測、體外全基因組檢測及基于細胞的全基因組檢測等方式檢測 CRISPR 脫靶突變,考慮到計算機預測的局限性、測序的成本及不同研究本身的特點不同,研究者可選擇最適合的方法或者組合方法檢測 CRISPR 脫靶突變。將來,商業化 CRISPR 脫靶突變檢測方法的發展必然可以促進脫靶檢測的廣泛應用,為改進 CRISPR 技術在人類疾病中應用的安全性鋪平道路。
2018 年 7 月,Ihry 等[73]發現 CRISPR 基因療法可能會增加致癌風險。研究者們在實驗室條件下利用 CRISPR-Cas9 技術剪切 DNA 時發現,該技術會導致細胞中 p53 的激活并引起基因編輯效率的降低;因此,p53 缺乏或不能被激活的細胞會顯示出更好的基因編輯效果,從而更有可能被挑選出來進行后續實驗;如果將此種抑癌基因表達缺乏的細胞移植入患者體內,可能會導致細胞增殖失控和癌變。但也有專家認為,p53 缺陷的細胞更容易被編輯并不一定意味著編輯后細胞更容易出現 p53 的缺陷,目前還無法證實 CRISPR 有致癌風險。另外,當需要實現大片段敲入、條件性敲除及點突變等較為復雜的基因修飾時,由于存在同源重組效率低的問題,CRISPR 技術的應用受到限制。
總之,研究者們在充分利用 CRISPR 技術眾多優勢的同時,需要清晰地認識到這場技術革命背后存在的問題。但是正是由于這些問題的存在,更加推動了該技術的完善和發展,將來 CRISPR 基因編輯技術必將被更廣泛地應用于臨床疾病的治療。