目前世界范圍內約有 2.4 億慢性乙型肝炎病毒(hepatitis B virus,HBV)感染者,HBV 感染是世界性的重大公共衛生難題。隨著分子生物學工具的不斷發展,目前第 3 代基因定點編輯技術 CRISPR/Cas9 作為熱點已經廣泛地應用于多種病毒的研究與實驗性治療中。該文簡要回顧了 HBV 基因組的特點、基因編輯技術的發展及原理和 CRISPR/Cas9 在 HBV 基因組抑制中的研究現狀及局限性。相對于鋅指核糖核酸酶和轉錄激活因子樣效應物核酸酶其他兩種基因編輯技術,CRISPR/Cas9 技術極大地提高了基因編輯的能力。雖然目前仍屬于概念證明階段,但多數基礎研究均證實了 CRISPR/Cas9 技術在體內外對 HBV 基因組具有編輯能力并能降低其 DNA 復制與病毒蛋白的表達能力。在潛在安全風險及基因編輯載體的輸送效率等問題得到解決后,CRISPR/Cas9 技術聯合逆轉錄抑制藥物的治療將為 HBV 感染的臨床治愈帶來曙光。
引用本文: 唐光敏, 周威龍. CRISPR/Cas9 技術在乙型肝炎病毒基因組抑制中的應用. 華西醫學, 2017, 32(12): 1967-1971. doi: 10.7507/1002-0179.201606030 復制
據估計,目前世界范圍內約有 2.4 億慢性乙型肝炎病毒(hepatitis B virus,HBV)感染者,其主要分布于低中收入國家。慢性 HBV 感染的主要并發癥包括肝硬化和原發性肝細胞癌。20%~30% 的慢性 HBV 感染者會逐漸進展為以上并發癥,并因肝硬化和(或)原發性肝細胞癌造成每年約 65 萬人的慢性 HBV 感染相關性死亡[1-2]。盡管有效的 HBV 疫苗已經被應用超過 30 年,成熟的高效核苷類似物抗病毒藥物與新劑型的干擾素也已投入臨床規范化治療,HBV 仍然位居十大世界范圍內導致人類死亡的疾病之列。隨著分子生物學工具的不斷發展,目前第 3 代基因定點編輯技術 CRISPR/Cas9 作為熱點已經廣泛地應用于多種病毒的研究與實驗性治療中。本文簡要回顧了 HBV 基因組的特點、CRISPR/Cas9 的發展及原理和 CRISPR/Cas9 在 HBV 基因組抑制中的研究現狀及問題,以期為進一步的研究提供相關背景知識。
1 HBV 基因組概述
HBV 為 DNA 病毒中的嗜肝病毒屬,與其他病毒不同,HBV 基因組為松弛、環狀、部分呈雙鏈結構(relaxed circular DNA,rcDNA),長度約 3.2 kb。雙鏈 5’端交錯排列且相互配對以維持環狀基因組結構,其中正鏈不完整擁有 5’端寡核苷酸帽;負鏈為完整環狀,但在特定位點有缺口并由病毒 DNA 聚合酶共價鏈接。正負鏈 5’端均包含直接重復區域(direct repeats,DR),區域內含有對病毒復制起始十分關鍵的 11 個核苷酸左右的重復序列(負鏈上稱為“DR1”,正鏈上稱為“DR2”)。
HBV 的基因組高度壓縮,擁有 4 組重疊的開放讀碼框,分別編碼:① P(Pol)ORF 編碼區編碼基因復制的核心酶病毒多聚酶組,其擁有 DNA 多聚酶,逆轉錄酶,核酶 H 的功能還負責 rcDNA 結構中負鏈 5’端與 3’端的鏈接(末端蛋白);② C 核心區基因編碼前核心蛋白與核心蛋白,它們參與包裹新生 rcDNA 構成核衣殼;③ S 表面區(surface,S)基因編碼 3 種不同包膜糖蛋白——前 S1 蛋白、前 S2 蛋白、S 蛋白,負責靶細胞的結合及亞細胞結構的定位,介導免疫耐受;④ X 區編碼X 蛋白在 HBV 感染慢性化及 HBV 相關肝細胞癌發病中有重要作用。此外基因組中還包含啟動子、增強子等調控元件與多聚腺苷化作用和病毒裝配的信號合成。rcDNA 進入細胞核后,利用宿主細胞DNA 修復機制將正鏈 5’端的寡核苷酸帽與負鏈 5’端的末端蛋白去除,恢復完整的正鏈并且鏈接負鏈 5’、3’端缺口形成具有超螺旋結構共價閉合環狀 DNA (covalently closed circular DNA,cccDNA)。cccDNA 一旦形成即標志著 HBV 感染成功,繼而以負鏈為模板便可轉錄出前基因組 RNA(pre-genomic RNA,pgRNA)和 3 條亞基因組 RNA。這些 RNA 除擁有宿主 RNA 5’端帽子和 3’端 poly-A 結構以便在細胞質中表達外,pgRNA 5’端和 3’端尚有 ε 莖環結構參與病毒 DNA 復制。與其他逆轉錄病毒不同,嗜肝病毒 DNA 的復制是以 pgRNA 為模板合成的。首先病毒 DNA 多聚酶 N 端TP 結構域和 pgRNA 5’端 ε 莖環結構相結合,結構域上的羥基連接上一份子 5’-鳥嘌呤脫氧核苷酸 dGMP,后續核苷酸以莖環突出部分序列為模板添加于其后。而后新生的 DNA 轉移到 pgRNA 3’端互補序列上形成第 1 次引物轉移,其機制尚不清楚。轉移后的 DNA 鏈以 pgRNA 為模板從其 3’端向 5’端方向逆轉錄形成 HBV DNA 的負鏈。逆轉錄過程的同時,作為模板的 pgRNA 則在核酶 H 作用下逐步降解直至只剩下其 5’端一段包含 DR1 序列長 15~18 nt 的寡核酸片段作為合成正鏈引物,負鏈完成后,其末端(3’端)由聚合酶 TP 結構域的羥基共價連接于其 5’端。同負鏈合成起始類似未降解的 pgRNA 寡核苷酸序列此時轉移到負鏈 5’端下游互補的 DR2 區域,發生第 2 次引物轉移且指導新生正鏈朝負鏈 5’端方向延長。當正鏈延長到負鏈 5’端時即發生模板轉換,轉換后的正鏈以負鏈 3’端序列為模板繼續延伸,此時整個基因組也因雙鏈堿基的互補配對呈現環形。
值得注意的是,HBV 基因組的復制、成熟及其表達和表達后的調控同步進行。這意味著以 pgRNA 為模板翻譯的核心蛋白完成后,將隨即包裹基因組并引導其進入肝細胞內質網。由于核心蛋白的包裹,病毒復制系統無法獲得細胞漿中的游離三磷酸脫氧核糖核苷酸 dNTP 作為正鏈繼續延伸的原料,導致正鏈合成的暫停或終止,形成嗜肝病毒特征性的 rcDNA。這些帶有核衣殼的 rcDNA 或再次進入細胞核形成 cccDNA 維持核內 cccDNA 池的穩定,或進入分泌途徑包裝成致病性的病毒顆粒外排。少數時候,上述第 2 次引物轉移不會發生,新生正鏈以位于負鏈 3’端的 pgRNA 引物為模板開始原位擴增,這將導致雙鏈線狀 DNA(double stranded linear DNA,dslDNA)代替 rcDNA。dslDNA 在 HBV 自然感染中的意義尚不清楚,但研究表明 dslDNA 仍然具有形成 cccDNA、表達基因組信息的能力,還可優先與宿主基因組發生融合。
2 基因編輯技術發展歷程及原理
2.1 早期發展的兩種基因編輯技術
限制性內切酶于 20 世紀 60 年代被首次分離鑒定,該酶可識別 DNA 中特定的片段并將其從內部或周邊切斷以保護產生該酶的細菌免受特異性噬菌體的裂解,宿主細胞則由修飾酶在內切酶識別的特異位點產生諸如腺嘌呤甲基化等的堿基共價修飾以保護噬菌體 DNA 清除過程中宿主 DNA 的完整。因此,限制性內切酶迅速成為基因重組研究中及其重要的工具。但自然界中內切酶識別的片段往往較短且呈回文結構,即便選擇擁有最長識別片段的限制性內切酶,其作用區域遠達不到大型病毒、哺乳動物基因組特異性單位點誘變的需求[3]。鋅指核酸酶(zinc finger endonuclease,ZFN)因其具有選擇性修飾病毒以及細胞基因組的潛能被開發為第 1 代解決上述問題的新技術。不同鋅指結構均含有約 30 個氨基酸的結構域,該結構域可以部分地特異結合 3 bp 長的 DNA 序列。將擁有不同 3 bp 序列的鋅指結構進行聚合,可使其特異性結合區域延長到 18 bp,從而帶來了高度選擇地結合人類基因組特異位點的可能。但鋅指結構自身不具備切割自身結合 DNA 序列的能力,為此往往將它們同非特異性 DNA 內切酶進行連接以完成 DNA 的裂解。FokⅠ 限制性內切酶是目前最為通用的 ZFN 內切酶,其優勢在于 Fok Ⅰ 酶必須形成同源二聚體才能表現出內切活性。這樣只需設計兩個不同的 ZFN 使它們分別識別目標序列鄰近部分相反鏈上的序列,鋅指結構連接的 FokⅠ 單體便可形成二聚體精確切割目標序列。切割產生的缺口由易錯性的非同源 DNA 末端裂解(non-homologous DNA end joining,NHEJ)途徑進行修復,修復的結構往往導致目標區基因的插入或缺失突變使得目標基因沉默。相反,如果目標基因經過 NHEJ 修復“不幸”恢復野生型,ZFN 則繼續在原區域進行特異性的結合——切割過程直到 NHEJ 修復產生的突變使得 ZFN 不能再特異性識別。
盡管 ZFN 已在哺乳動物細胞 DNA 編輯與抑制病毒 DNA 復制的工作中展現出卓越的實用性,然而構成 ZFN 體系鋅指結構的目標序列往往無法嚴格達到設計要求的特異性,同時可以識別任意設計目標序列的鋅指結構尚未被分離[4-5]。針對 ZFN 存在的問題,轉錄激活物樣核酸酶(transcription activator like endonucleases,TALEN)作為第 2 代基因定點編輯技術被成功開發。TALEN 與 ZFN 的 DNA 結合模體結構不同,系由植物病原菌黃單胞桿菌中分離得到,包含 4~34 個氨基酸結構域,每一個結構域可高特異地識別單個 DNA 堿基對。像 ZFN 一樣,針對研究目標,只要逐一添加識別特定堿基對得到兩個 TALEN 異二聚體,使它們從兩條鏈分別識別目標序列的上下游部分,再由其連接的 FokⅠ 內切酶特異性切割目標序列產生缺口,繼而由易錯性的修復引發誘變。通常情況下單個 TALEN 的識別序列一般為 16 bp,整個異二聚體覆蓋約 32 bp 區域以提高結合的特異性,避免脫靶效應。與 ZFN 相比,盡管 TALEN 擁有更高的準確性、特異性,然而其合成的難度、費用較高,還存在一定的生物毒性,同時 TALEN 往往大于其病毒表達載體。以上因素在一定程度上限制了 TALEN 技術的應用[6]。
2.2 CRISPR/Cas9 技術
鑒于 ZFN 和 TALEN 技術的局限,CRISPR/Cas9 作為第 3 代基因定點編輯技術逐漸成為最新的研究熱點。CRISPR/Cas 是成簇規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeat sequences,CRISPR)及其相關蛋白(CRISPR-associated,Cas)系統的縮寫。自然界中病毒是最為豐富的生物實體,它們能高效、快速地感染不同環境中的宿主[7]。相應地,作為感染目標的宿主也在進化中產生了以限制性內切酶為代表的非特異免疫和以 CRISPR/Cas 系統為代表的基于 RNA 介導的適應性免疫系統以清除病毒。野生的 CRISPR/Cas 系統根據其行使免疫功能作用的保守蛋白和蛋白-RNA 結合方式與 DNA 裂解機制不同可分為 3 個亞型(typeⅠ、typeⅡ、typeⅢ),亞型間具有以下相同的特征:① 由間隔序列(spacer)分割的保守成簇規律間隔短回文 CRISPR 片段;② spacer 主要來自于外源感染的噬菌體等流動性的基因元件;③ CRISPR 序列旁為 Cas 基因,其編碼的 Cas 蛋白與 CRISPR 轉錄序列一同發揮免疫作用[8]。在外源噬菌體感染的初始階段,各型 CRISPR/Cas 系統共表達的 Cas1-Cas2 蛋白識別外源 DNA 中的前間隔序列并將其剪接到宿主 CRISPR 的重復片段間形成新的 spacer。此過程中 typeⅠ 和 typeⅡ 需要 protospace 相鄰的前間隔序列相鄰模體(protospacer adjacent motif,PAM)的輔助。PAM 是一段 2~5 bp 長的保守序列,在任何基因組中只要存在 PAM,其側翼的片段就都有被整合進入宿主 CRISPR 序列的可能。當 protospcaer 剪接到 CRISPR 序列中后,CRISPR 即轉錄成為一條前體 crRNA 繼而進一步剪切為小片段的成熟 crRNA 分子。那些包含有獲得性病毒基因序列的成熟 crRNA 將被包裹進入 CRISPR 核苷酸蛋白復合體(CRISPR ribonucleoprotein complexes,crRNP),并在再次接觸同樣的病毒感染時特異地介導病毒基因組降解[9-12]。3 種亞型構成的 crRNP 中保守蛋白分別是:typeⅠCas3 蛋白,typeⅡCas 9 蛋白,typeⅢCas10 蛋白;其中 CRISPR/Cas3(typeⅠ)和 CRISPR/Cas10(typeⅢ)除 crRNA 和保守蛋白外尚需募集其他蛋白才能發揮免疫作用,相對而言 CRISPR/Cas9(typeⅡ)僅需要 Cas9 蛋白和輔助的反式激活 RNA(trans-activating RNA,tracrRNA),因而成為 3 型中最理想的選擇。
以目前研究中最普遍使用的化膿性鏈球菌 Cas9(Streptococcus pyogenes,Spy Cas9)蛋白為例說明使用 CRISPR/Cas9 進行基因編輯的原理。經 Cas1、Cas3 切割、含有識別外源 DNA 成熟 crRNA 中的保守序列和 tracrRNA 形成二聚體并與 Spy Cas9 聚合為 crRNP,Spy Cas9 與含有 5’-NGG-3’序列的 PAM 發生結合,如果結合的 DNA 雙鏈恰好擁有與 crRNA5’端 spacer 的互補序列,則 Spy Cas9 將在 PAM 位點切割雙鏈,其中 Cas9 蛋白 HNH 亞基負責 crRNA 互補鏈,RuvC 結構域負責非互補鏈的切割。切割位點由 NHEJ 機制修復。同時野生型 Spy Cas9 蛋白所需的 crRNA-tracrRNA 異二聚體可被基于目標基因而人工合成的帶有莖環結構的 crRNA-tracrRNA 所取代,故而只需將它們含有目標片段互補序列的 crRNA、tracrRNA 和 cas9 一同裝入載體即可進行目標細胞內靶基因的定點編輯[13-20]。
3 CRISPR/Cas9 對 HBV 基因組抑制的研究現狀及局限性
理論上來說,只需選擇 HBV 基因組中 4 個 ORF 及 7 種結構蛋白編碼的任一序列作為目標進行基因編輯即可阻止 HBV 基因組的復制與表達。Lin 等[21]首次報道了 CRISPR/cas9 系統可以分別干擾體內及體外的 HBV 復制。研究中選擇 HBV 特異 Cas9/sgRNA 和 HBV 表達質粒共轉染 Huh7 肝癌細胞系細胞,共轉染后細胞內 HBV 核定蛋白與 S 蛋白表達顯著降低。該 Cas9/sgRNA 復合物也同樣抑制了水轉化小鼠模型中肝內 HBV 表達載體的表達,降低小鼠血清中乙型肝炎表面抗原(hepatitis B surface antigen,HBsAg)的水平。這些結果說明 CRISPR/cas9 系統能在體內外破壞 HBV 表達模板,有根除持續性 HBV 感染的潛力。Kennedy 等[22]進一步發現,選擇慢病毒載體的 HBV 特異 Cas9/sgRNA 可在體外有效地將新感染 HBV HepaRG 細胞及慢性 HBV 感染 HepAD38 細胞中 HBV DNA 的合成降低 1 000 倍以上,cccDNA 的蓄積減少 10 倍以上,且使得絕大多數殘余的病毒 DNA 突變失活,提示 CRISPR/cas 系統可作為清除慢性 HBV 感染體內 cccDNA 池的有力工具。在另一項研究中,Liu 等[23]報道基于 Cas9/sgRNA 介導的模板易錯修復或模板清除,不同基因型 HBV 的 DNA 復制在體內外均可以被抑制,而且利用不同的 gRNA/Cas9 系統組合能有效清除 HBV DNA。Zhen 等[24]選擇病毒表面蛋白 ORF 作為靶序列,HepG2.2.15 細胞培養液與水轉化小鼠模型血清中的 HBsAg 水平經過 CRISPR/Cas9 干預均出現下降,鼠肝臟中的 HBV DNA 復制與 HBsAg 表達也被顯著地抑制,而且 CRISPR/Cas9 系統能夠使 HBV 的 DNA 產生有效突變;該研究結果表明,CRISPR/Cas9 可在體內外抑制 HBV 的復制和表達,可能成為治療 HBV 感染的一種新方法。Dong 等[25]研究表明,在前 cccDNA 轉染的 Huh7 細胞、HBV 復制性細胞 HepG2.2.15 及攜帶 cccDNA 的小鼠模型中 CRISPR/Cas 對于肝細胞內的 cccDNA 水平及病毒復制有抑制作用,說明 CRISPR/Cas9 系統能夠準確、高效地靶向 HBV cccDNA 和抑制 HBV 復制。Ramanan 等[26]發現針對野生型 HBV 保守序列的 sgRNA 對體內外模型中病體分離 HBV 毒株的復制仍有抑制作用,證實了 CRISPR/Cas9 直接靶向作用于 HBV cccDNA 的抗病毒潛力。Karimova 等[27]發現,CRISPR/Cas9 可特異、高效地靶向切割 HBV 基因組的 S 區域和 X 區域中的保守序列,對 Hela 細胞、HEK293 細胞系中 HBV cccDNA 和宿主整合 HBV DNA 均具有裂解作用,進一步論證了 CRISPR/Cas9 用于治療 HBV 感染的可行性。此外,Wang 等[28]研究報道,雙 gRNAs 導向 CRISPR/Cas9 系統可有效破壞 A~D 基因型的 HBV 表達模板、抑制 HBV 病毒復制且無明顯的細胞毒性,因而可能成為在慢性 HBV 感染患者中根除持續存在的 HBV cccDNA 的一種新策略。綜上,近年的研究均證明了 CRISPR/Cas9 系統擁有在體內外抑制 HBV 基因組的復制與表達的能力,展現了其作為急慢性 HBV 感染新治療方法的潛力。
雖然現階段的研究均展示了 CRISPR/Cas9 在 HBV 治療中良好的前景,但是仍存在以下問題。首先,HBV 并不嚴格的寄生于肝細胞,人體內一系列肝外細胞均能發現 HBV DNA 并且允許其復制[28-31]。為了達到 HBV 治療的終點——徹底清除病毒,就必須將特異的 Cas9/sgRNA 序列運送到持續感染的肝細胞及肝外保毒細胞中。除此以外,為了在活體內發揮持續的抗病毒功效,載體還必須滿足低免疫原性、高轉染率,同時不與宿主基因 DNA 發生融合。針對以上要求,重組腺相關病毒載體是目前最佳的選擇,但是其載量對于長度超過 4.5 kb 的人類Cas9 基因、sgRNA 和調控元件系統顯然不足。為此必須選擇更小的 Cas9 同源基因材料等對整個 Cas9/sgRNA 體系進行瘦身[32-33]。其次,即使 Cas9 基因編輯載體的構建難度遠遠低于 ZFN 與 TALENS,CRISPR/Cas9 卻存在較高的脫靶現象,最甚者出現了 sgRNA 對基因組中高達 5 個核苷酸的錯配位點進行編輯的案例[34]。對此,目前主要的幾種解決辦法是:① 利用只有切割單鏈活性的變異 Cas9 蛋白(Cas9 nickase,Cas9n)的“配對切割”策略——與標準的 Cas9 切割產生的 DNA 雙鏈斷鏈相比,Cas9 裂解產生的切口可以使用另一條完整鏈為模板完成修復,故要求進行修飾需要位點正反方向均為 5’-NGG-3’ 識別位點并同時出現兩條 sgRNA 才能對目的位點進行剪切,該方法從理論上提高了修飾位點的特異性,而研究結果顯示該技術可以使其脫靶率較野生 CRISPR/Cas 體系降低 1 500 倍以上[35];② 將 sgRNA5’端與目標序列互補的堿基長度縮短,Fu 等[36]的研究中顯示 17 或 18 個 nt 的 sgRNA5’端目標序列互補區可以使得結合率提高 5 000 倍;③ 與上述相反——延長 sgRNA 的結合序列使之在兩條鏈上從相反順序接近目標序列,同時將它們與失去剪切酶活性的 Dead Cas9n(dCAS9)與FokⅠ 限制性內切酶結合,FokⅠ 限制性內切酶在 sgRNA 及 dCAS9 指導下對目的位點進行剪切,這一方法在人體細胞內的特異性較傳統體系可提高約 140 倍[37]。然而,此法在降低脫靶率的同時也降低了基因編輯的效率。最后,在慢性 HBV 感染或者肝細胞癌的患者中經常可以發現 HBV 亞基因組 DNA 碎片整合到宿主基因組中[38],該現象提示,經由 CRISPR/Cas9 切割的 HBV DNA 片段也可能與宿主基因融合導致 InDel 突變,干擾素宿主基因的正常功能。
4 結語
CRISPR/Cas9 技術極大地提高了我們基因編輯的能力,開啟了疾病基因治療的新時代。雖然目前仍屬于概念證明階段,但多數基礎研究均證實了 CRISPR/Cas9 技術在體內外對 HBV 病毒基因組具有編輯能力并能降低其 DNA 復制與病毒蛋白的表達能力。我們相信,隨著 CRISPR/Cas9 技術不斷發展和相關研究逐漸深入,在潛在安全風險及基因編輯載體的輸送效率等問題解決后,CRISPR/Cas9 技術聯合逆轉錄抑制藥物的治療將為 HBV 感染的臨床治愈帶來曙光。
據估計,目前世界范圍內約有 2.4 億慢性乙型肝炎病毒(hepatitis B virus,HBV)感染者,其主要分布于低中收入國家。慢性 HBV 感染的主要并發癥包括肝硬化和原發性肝細胞癌。20%~30% 的慢性 HBV 感染者會逐漸進展為以上并發癥,并因肝硬化和(或)原發性肝細胞癌造成每年約 65 萬人的慢性 HBV 感染相關性死亡[1-2]。盡管有效的 HBV 疫苗已經被應用超過 30 年,成熟的高效核苷類似物抗病毒藥物與新劑型的干擾素也已投入臨床規范化治療,HBV 仍然位居十大世界范圍內導致人類死亡的疾病之列。隨著分子生物學工具的不斷發展,目前第 3 代基因定點編輯技術 CRISPR/Cas9 作為熱點已經廣泛地應用于多種病毒的研究與實驗性治療中。本文簡要回顧了 HBV 基因組的特點、CRISPR/Cas9 的發展及原理和 CRISPR/Cas9 在 HBV 基因組抑制中的研究現狀及問題,以期為進一步的研究提供相關背景知識。
1 HBV 基因組概述
HBV 為 DNA 病毒中的嗜肝病毒屬,與其他病毒不同,HBV 基因組為松弛、環狀、部分呈雙鏈結構(relaxed circular DNA,rcDNA),長度約 3.2 kb。雙鏈 5’端交錯排列且相互配對以維持環狀基因組結構,其中正鏈不完整擁有 5’端寡核苷酸帽;負鏈為完整環狀,但在特定位點有缺口并由病毒 DNA 聚合酶共價鏈接。正負鏈 5’端均包含直接重復區域(direct repeats,DR),區域內含有對病毒復制起始十分關鍵的 11 個核苷酸左右的重復序列(負鏈上稱為“DR1”,正鏈上稱為“DR2”)。
HBV 的基因組高度壓縮,擁有 4 組重疊的開放讀碼框,分別編碼:① P(Pol)ORF 編碼區編碼基因復制的核心酶病毒多聚酶組,其擁有 DNA 多聚酶,逆轉錄酶,核酶 H 的功能還負責 rcDNA 結構中負鏈 5’端與 3’端的鏈接(末端蛋白);② C 核心區基因編碼前核心蛋白與核心蛋白,它們參與包裹新生 rcDNA 構成核衣殼;③ S 表面區(surface,S)基因編碼 3 種不同包膜糖蛋白——前 S1 蛋白、前 S2 蛋白、S 蛋白,負責靶細胞的結合及亞細胞結構的定位,介導免疫耐受;④ X 區編碼X 蛋白在 HBV 感染慢性化及 HBV 相關肝細胞癌發病中有重要作用。此外基因組中還包含啟動子、增強子等調控元件與多聚腺苷化作用和病毒裝配的信號合成。rcDNA 進入細胞核后,利用宿主細胞DNA 修復機制將正鏈 5’端的寡核苷酸帽與負鏈 5’端的末端蛋白去除,恢復完整的正鏈并且鏈接負鏈 5’、3’端缺口形成具有超螺旋結構共價閉合環狀 DNA (covalently closed circular DNA,cccDNA)。cccDNA 一旦形成即標志著 HBV 感染成功,繼而以負鏈為模板便可轉錄出前基因組 RNA(pre-genomic RNA,pgRNA)和 3 條亞基因組 RNA。這些 RNA 除擁有宿主 RNA 5’端帽子和 3’端 poly-A 結構以便在細胞質中表達外,pgRNA 5’端和 3’端尚有 ε 莖環結構參與病毒 DNA 復制。與其他逆轉錄病毒不同,嗜肝病毒 DNA 的復制是以 pgRNA 為模板合成的。首先病毒 DNA 多聚酶 N 端TP 結構域和 pgRNA 5’端 ε 莖環結構相結合,結構域上的羥基連接上一份子 5’-鳥嘌呤脫氧核苷酸 dGMP,后續核苷酸以莖環突出部分序列為模板添加于其后。而后新生的 DNA 轉移到 pgRNA 3’端互補序列上形成第 1 次引物轉移,其機制尚不清楚。轉移后的 DNA 鏈以 pgRNA 為模板從其 3’端向 5’端方向逆轉錄形成 HBV DNA 的負鏈。逆轉錄過程的同時,作為模板的 pgRNA 則在核酶 H 作用下逐步降解直至只剩下其 5’端一段包含 DR1 序列長 15~18 nt 的寡核酸片段作為合成正鏈引物,負鏈完成后,其末端(3’端)由聚合酶 TP 結構域的羥基共價連接于其 5’端。同負鏈合成起始類似未降解的 pgRNA 寡核苷酸序列此時轉移到負鏈 5’端下游互補的 DR2 區域,發生第 2 次引物轉移且指導新生正鏈朝負鏈 5’端方向延長。當正鏈延長到負鏈 5’端時即發生模板轉換,轉換后的正鏈以負鏈 3’端序列為模板繼續延伸,此時整個基因組也因雙鏈堿基的互補配對呈現環形。
值得注意的是,HBV 基因組的復制、成熟及其表達和表達后的調控同步進行。這意味著以 pgRNA 為模板翻譯的核心蛋白完成后,將隨即包裹基因組并引導其進入肝細胞內質網。由于核心蛋白的包裹,病毒復制系統無法獲得細胞漿中的游離三磷酸脫氧核糖核苷酸 dNTP 作為正鏈繼續延伸的原料,導致正鏈合成的暫停或終止,形成嗜肝病毒特征性的 rcDNA。這些帶有核衣殼的 rcDNA 或再次進入細胞核形成 cccDNA 維持核內 cccDNA 池的穩定,或進入分泌途徑包裝成致病性的病毒顆粒外排。少數時候,上述第 2 次引物轉移不會發生,新生正鏈以位于負鏈 3’端的 pgRNA 引物為模板開始原位擴增,這將導致雙鏈線狀 DNA(double stranded linear DNA,dslDNA)代替 rcDNA。dslDNA 在 HBV 自然感染中的意義尚不清楚,但研究表明 dslDNA 仍然具有形成 cccDNA、表達基因組信息的能力,還可優先與宿主基因組發生融合。
2 基因編輯技術發展歷程及原理
2.1 早期發展的兩種基因編輯技術
限制性內切酶于 20 世紀 60 年代被首次分離鑒定,該酶可識別 DNA 中特定的片段并將其從內部或周邊切斷以保護產生該酶的細菌免受特異性噬菌體的裂解,宿主細胞則由修飾酶在內切酶識別的特異位點產生諸如腺嘌呤甲基化等的堿基共價修飾以保護噬菌體 DNA 清除過程中宿主 DNA 的完整。因此,限制性內切酶迅速成為基因重組研究中及其重要的工具。但自然界中內切酶識別的片段往往較短且呈回文結構,即便選擇擁有最長識別片段的限制性內切酶,其作用區域遠達不到大型病毒、哺乳動物基因組特異性單位點誘變的需求[3]。鋅指核酸酶(zinc finger endonuclease,ZFN)因其具有選擇性修飾病毒以及細胞基因組的潛能被開發為第 1 代解決上述問題的新技術。不同鋅指結構均含有約 30 個氨基酸的結構域,該結構域可以部分地特異結合 3 bp 長的 DNA 序列。將擁有不同 3 bp 序列的鋅指結構進行聚合,可使其特異性結合區域延長到 18 bp,從而帶來了高度選擇地結合人類基因組特異位點的可能。但鋅指結構自身不具備切割自身結合 DNA 序列的能力,為此往往將它們同非特異性 DNA 內切酶進行連接以完成 DNA 的裂解。FokⅠ 限制性內切酶是目前最為通用的 ZFN 內切酶,其優勢在于 Fok Ⅰ 酶必須形成同源二聚體才能表現出內切活性。這樣只需設計兩個不同的 ZFN 使它們分別識別目標序列鄰近部分相反鏈上的序列,鋅指結構連接的 FokⅠ 單體便可形成二聚體精確切割目標序列。切割產生的缺口由易錯性的非同源 DNA 末端裂解(non-homologous DNA end joining,NHEJ)途徑進行修復,修復的結構往往導致目標區基因的插入或缺失突變使得目標基因沉默。相反,如果目標基因經過 NHEJ 修復“不幸”恢復野生型,ZFN 則繼續在原區域進行特異性的結合——切割過程直到 NHEJ 修復產生的突變使得 ZFN 不能再特異性識別。
盡管 ZFN 已在哺乳動物細胞 DNA 編輯與抑制病毒 DNA 復制的工作中展現出卓越的實用性,然而構成 ZFN 體系鋅指結構的目標序列往往無法嚴格達到設計要求的特異性,同時可以識別任意設計目標序列的鋅指結構尚未被分離[4-5]。針對 ZFN 存在的問題,轉錄激活物樣核酸酶(transcription activator like endonucleases,TALEN)作為第 2 代基因定點編輯技術被成功開發。TALEN 與 ZFN 的 DNA 結合模體結構不同,系由植物病原菌黃單胞桿菌中分離得到,包含 4~34 個氨基酸結構域,每一個結構域可高特異地識別單個 DNA 堿基對。像 ZFN 一樣,針對研究目標,只要逐一添加識別特定堿基對得到兩個 TALEN 異二聚體,使它們從兩條鏈分別識別目標序列的上下游部分,再由其連接的 FokⅠ 內切酶特異性切割目標序列產生缺口,繼而由易錯性的修復引發誘變。通常情況下單個 TALEN 的識別序列一般為 16 bp,整個異二聚體覆蓋約 32 bp 區域以提高結合的特異性,避免脫靶效應。與 ZFN 相比,盡管 TALEN 擁有更高的準確性、特異性,然而其合成的難度、費用較高,還存在一定的生物毒性,同時 TALEN 往往大于其病毒表達載體。以上因素在一定程度上限制了 TALEN 技術的應用[6]。
2.2 CRISPR/Cas9 技術
鑒于 ZFN 和 TALEN 技術的局限,CRISPR/Cas9 作為第 3 代基因定點編輯技術逐漸成為最新的研究熱點。CRISPR/Cas 是成簇規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeat sequences,CRISPR)及其相關蛋白(CRISPR-associated,Cas)系統的縮寫。自然界中病毒是最為豐富的生物實體,它們能高效、快速地感染不同環境中的宿主[7]。相應地,作為感染目標的宿主也在進化中產生了以限制性內切酶為代表的非特異免疫和以 CRISPR/Cas 系統為代表的基于 RNA 介導的適應性免疫系統以清除病毒。野生的 CRISPR/Cas 系統根據其行使免疫功能作用的保守蛋白和蛋白-RNA 結合方式與 DNA 裂解機制不同可分為 3 個亞型(typeⅠ、typeⅡ、typeⅢ),亞型間具有以下相同的特征:① 由間隔序列(spacer)分割的保守成簇規律間隔短回文 CRISPR 片段;② spacer 主要來自于外源感染的噬菌體等流動性的基因元件;③ CRISPR 序列旁為 Cas 基因,其編碼的 Cas 蛋白與 CRISPR 轉錄序列一同發揮免疫作用[8]。在外源噬菌體感染的初始階段,各型 CRISPR/Cas 系統共表達的 Cas1-Cas2 蛋白識別外源 DNA 中的前間隔序列并將其剪接到宿主 CRISPR 的重復片段間形成新的 spacer。此過程中 typeⅠ 和 typeⅡ 需要 protospace 相鄰的前間隔序列相鄰模體(protospacer adjacent motif,PAM)的輔助。PAM 是一段 2~5 bp 長的保守序列,在任何基因組中只要存在 PAM,其側翼的片段就都有被整合進入宿主 CRISPR 序列的可能。當 protospcaer 剪接到 CRISPR 序列中后,CRISPR 即轉錄成為一條前體 crRNA 繼而進一步剪切為小片段的成熟 crRNA 分子。那些包含有獲得性病毒基因序列的成熟 crRNA 將被包裹進入 CRISPR 核苷酸蛋白復合體(CRISPR ribonucleoprotein complexes,crRNP),并在再次接觸同樣的病毒感染時特異地介導病毒基因組降解[9-12]。3 種亞型構成的 crRNP 中保守蛋白分別是:typeⅠCas3 蛋白,typeⅡCas 9 蛋白,typeⅢCas10 蛋白;其中 CRISPR/Cas3(typeⅠ)和 CRISPR/Cas10(typeⅢ)除 crRNA 和保守蛋白外尚需募集其他蛋白才能發揮免疫作用,相對而言 CRISPR/Cas9(typeⅡ)僅需要 Cas9 蛋白和輔助的反式激活 RNA(trans-activating RNA,tracrRNA),因而成為 3 型中最理想的選擇。
以目前研究中最普遍使用的化膿性鏈球菌 Cas9(Streptococcus pyogenes,Spy Cas9)蛋白為例說明使用 CRISPR/Cas9 進行基因編輯的原理。經 Cas1、Cas3 切割、含有識別外源 DNA 成熟 crRNA 中的保守序列和 tracrRNA 形成二聚體并與 Spy Cas9 聚合為 crRNP,Spy Cas9 與含有 5’-NGG-3’序列的 PAM 發生結合,如果結合的 DNA 雙鏈恰好擁有與 crRNA5’端 spacer 的互補序列,則 Spy Cas9 將在 PAM 位點切割雙鏈,其中 Cas9 蛋白 HNH 亞基負責 crRNA 互補鏈,RuvC 結構域負責非互補鏈的切割。切割位點由 NHEJ 機制修復。同時野生型 Spy Cas9 蛋白所需的 crRNA-tracrRNA 異二聚體可被基于目標基因而人工合成的帶有莖環結構的 crRNA-tracrRNA 所取代,故而只需將它們含有目標片段互補序列的 crRNA、tracrRNA 和 cas9 一同裝入載體即可進行目標細胞內靶基因的定點編輯[13-20]。
3 CRISPR/Cas9 對 HBV 基因組抑制的研究現狀及局限性
理論上來說,只需選擇 HBV 基因組中 4 個 ORF 及 7 種結構蛋白編碼的任一序列作為目標進行基因編輯即可阻止 HBV 基因組的復制與表達。Lin 等[21]首次報道了 CRISPR/cas9 系統可以分別干擾體內及體外的 HBV 復制。研究中選擇 HBV 特異 Cas9/sgRNA 和 HBV 表達質粒共轉染 Huh7 肝癌細胞系細胞,共轉染后細胞內 HBV 核定蛋白與 S 蛋白表達顯著降低。該 Cas9/sgRNA 復合物也同樣抑制了水轉化小鼠模型中肝內 HBV 表達載體的表達,降低小鼠血清中乙型肝炎表面抗原(hepatitis B surface antigen,HBsAg)的水平。這些結果說明 CRISPR/cas9 系統能在體內外破壞 HBV 表達模板,有根除持續性 HBV 感染的潛力。Kennedy 等[22]進一步發現,選擇慢病毒載體的 HBV 特異 Cas9/sgRNA 可在體外有效地將新感染 HBV HepaRG 細胞及慢性 HBV 感染 HepAD38 細胞中 HBV DNA 的合成降低 1 000 倍以上,cccDNA 的蓄積減少 10 倍以上,且使得絕大多數殘余的病毒 DNA 突變失活,提示 CRISPR/cas 系統可作為清除慢性 HBV 感染體內 cccDNA 池的有力工具。在另一項研究中,Liu 等[23]報道基于 Cas9/sgRNA 介導的模板易錯修復或模板清除,不同基因型 HBV 的 DNA 復制在體內外均可以被抑制,而且利用不同的 gRNA/Cas9 系統組合能有效清除 HBV DNA。Zhen 等[24]選擇病毒表面蛋白 ORF 作為靶序列,HepG2.2.15 細胞培養液與水轉化小鼠模型血清中的 HBsAg 水平經過 CRISPR/Cas9 干預均出現下降,鼠肝臟中的 HBV DNA 復制與 HBsAg 表達也被顯著地抑制,而且 CRISPR/Cas9 系統能夠使 HBV 的 DNA 產生有效突變;該研究結果表明,CRISPR/Cas9 可在體內外抑制 HBV 的復制和表達,可能成為治療 HBV 感染的一種新方法。Dong 等[25]研究表明,在前 cccDNA 轉染的 Huh7 細胞、HBV 復制性細胞 HepG2.2.15 及攜帶 cccDNA 的小鼠模型中 CRISPR/Cas 對于肝細胞內的 cccDNA 水平及病毒復制有抑制作用,說明 CRISPR/Cas9 系統能夠準確、高效地靶向 HBV cccDNA 和抑制 HBV 復制。Ramanan 等[26]發現針對野生型 HBV 保守序列的 sgRNA 對體內外模型中病體分離 HBV 毒株的復制仍有抑制作用,證實了 CRISPR/Cas9 直接靶向作用于 HBV cccDNA 的抗病毒潛力。Karimova 等[27]發現,CRISPR/Cas9 可特異、高效地靶向切割 HBV 基因組的 S 區域和 X 區域中的保守序列,對 Hela 細胞、HEK293 細胞系中 HBV cccDNA 和宿主整合 HBV DNA 均具有裂解作用,進一步論證了 CRISPR/Cas9 用于治療 HBV 感染的可行性。此外,Wang 等[28]研究報道,雙 gRNAs 導向 CRISPR/Cas9 系統可有效破壞 A~D 基因型的 HBV 表達模板、抑制 HBV 病毒復制且無明顯的細胞毒性,因而可能成為在慢性 HBV 感染患者中根除持續存在的 HBV cccDNA 的一種新策略。綜上,近年的研究均證明了 CRISPR/Cas9 系統擁有在體內外抑制 HBV 基因組的復制與表達的能力,展現了其作為急慢性 HBV 感染新治療方法的潛力。
雖然現階段的研究均展示了 CRISPR/Cas9 在 HBV 治療中良好的前景,但是仍存在以下問題。首先,HBV 并不嚴格的寄生于肝細胞,人體內一系列肝外細胞均能發現 HBV DNA 并且允許其復制[28-31]。為了達到 HBV 治療的終點——徹底清除病毒,就必須將特異的 Cas9/sgRNA 序列運送到持續感染的肝細胞及肝外保毒細胞中。除此以外,為了在活體內發揮持續的抗病毒功效,載體還必須滿足低免疫原性、高轉染率,同時不與宿主基因 DNA 發生融合。針對以上要求,重組腺相關病毒載體是目前最佳的選擇,但是其載量對于長度超過 4.5 kb 的人類Cas9 基因、sgRNA 和調控元件系統顯然不足。為此必須選擇更小的 Cas9 同源基因材料等對整個 Cas9/sgRNA 體系進行瘦身[32-33]。其次,即使 Cas9 基因編輯載體的構建難度遠遠低于 ZFN 與 TALENS,CRISPR/Cas9 卻存在較高的脫靶現象,最甚者出現了 sgRNA 對基因組中高達 5 個核苷酸的錯配位點進行編輯的案例[34]。對此,目前主要的幾種解決辦法是:① 利用只有切割單鏈活性的變異 Cas9 蛋白(Cas9 nickase,Cas9n)的“配對切割”策略——與標準的 Cas9 切割產生的 DNA 雙鏈斷鏈相比,Cas9 裂解產生的切口可以使用另一條完整鏈為模板完成修復,故要求進行修飾需要位點正反方向均為 5’-NGG-3’ 識別位點并同時出現兩條 sgRNA 才能對目的位點進行剪切,該方法從理論上提高了修飾位點的特異性,而研究結果顯示該技術可以使其脫靶率較野生 CRISPR/Cas 體系降低 1 500 倍以上[35];② 將 sgRNA5’端與目標序列互補的堿基長度縮短,Fu 等[36]的研究中顯示 17 或 18 個 nt 的 sgRNA5’端目標序列互補區可以使得結合率提高 5 000 倍;③ 與上述相反——延長 sgRNA 的結合序列使之在兩條鏈上從相反順序接近目標序列,同時將它們與失去剪切酶活性的 Dead Cas9n(dCAS9)與FokⅠ 限制性內切酶結合,FokⅠ 限制性內切酶在 sgRNA 及 dCAS9 指導下對目的位點進行剪切,這一方法在人體細胞內的特異性較傳統體系可提高約 140 倍[37]。然而,此法在降低脫靶率的同時也降低了基因編輯的效率。最后,在慢性 HBV 感染或者肝細胞癌的患者中經常可以發現 HBV 亞基因組 DNA 碎片整合到宿主基因組中[38],該現象提示,經由 CRISPR/Cas9 切割的 HBV DNA 片段也可能與宿主基因融合導致 InDel 突變,干擾素宿主基因的正常功能。
4 結語
CRISPR/Cas9 技術極大地提高了我們基因編輯的能力,開啟了疾病基因治療的新時代。雖然目前仍屬于概念證明階段,但多數基礎研究均證實了 CRISPR/Cas9 技術在體內外對 HBV 病毒基因組具有編輯能力并能降低其 DNA 復制與病毒蛋白的表達能力。我們相信,隨著 CRISPR/Cas9 技術不斷發展和相關研究逐漸深入,在潛在安全風險及基因編輯載體的輸送效率等問題解決后,CRISPR/Cas9 技術聯合逆轉錄抑制藥物的治療將為 HBV 感染的臨床治愈帶來曙光。