對特定序列的雙鏈 DNA(dsDNA)的識別是近幾十年來生物醫學和分子生物學等領域一大研究熱點。利用原有的核苷酸或人工設計的化學分子配體與 dsDNA 序列之間的特異性識別作用,基因疾病診斷、基因治療、基因編輯可以被實現。發卡型寡聚酰胺是一種能在 dsDNA 螺旋小溝處以較好的親和力特異性結合 dsDNA 序列的分子配體,具有良好細胞膜通透性、胞內穩定性等優點。本文綜述了發卡型寡聚酰胺對 dsDNA 的識別性質及其在生物化學、生物醫學等方面的應用,為發卡型寡聚酰胺的設計及應用提供參考。
引用本文: 李文佳, 石環環, 董波, 劉正春. 發卡型寡聚酰胺對雙鏈 DNA 的識別研究. 生物醫學工程學雜志, 2017, 34(1): 134-139. doi: 10.7507/1001-5515.201603004 復制
引言
發卡型寡聚酰胺是一種擁有良好細胞膜、核膜通透性[1],能夠在雙鏈脫氧核糖核酸(double strand deoxyribonucleic acid,dsDNA)螺旋小溝處識別特定序列的分子配體。發卡型寡聚酰胺通過三種五環結構單元[N-甲基咪唑(N-methylimidazole,Im)、N-甲基吡咯(N-methylpyrrole,Py)、N-甲基-3-羥基吡咯(3-hydroxypyrrole,Hp)]的四種組合 Im/Py、Py/Im、Py/Py(或Hp/Py)、Py/Py(或Py/Hp)分別識 dsDNA 的 G-C、C-G、T-A 和 A-T 四種堿基對。8 環發卡型寡聚酰胺能以媲美 DNA 結合蛋白的親和力和優秀的特異性結合 dsDNA[2]。不同于天然的核酸、蛋白質,發卡型寡聚酰胺能完全抵抗核酸酶的降解,具有良好的細胞內穩定性。近年來大量研究從事發卡型寡聚酰胺在基因治療、基因調控以及基因編輯等領域的應用[3-5]。本文綜述了發卡型寡聚酰胺對 dsDNA 的識別機制及其應用研究進展。
1 發卡型寡聚酰胺識別 dsDNA
1.1 發卡型寡聚酰胺的出現
在 1992 年,Mrksich 等[6]首次使用核磁共振波譜法證實:兩條寡聚酰胺分子 ImPyPy 能特異性地以反向肩并肩的相對位置結合在同一 dsDNA 序列 5′-TGACT-3′ 的小溝。在形成的這種以 2∶1 比例結合的復合物中,兩條寡聚酰胺分子相對的芳香環能一同組合識別堿基對,并與同側 DNA 鏈堿基形成氫鍵:寡聚酰胺中酰胺基的 NH 與對應的堿基 A 的N3 原子、堿基 T 和 C 的 O2 原子形成氫鍵、堿基 G 的 NH2與Im 的 N3 形成氫鍵。兩條寡聚酰胺分子芳香環的交錯排布,酰胺鍵與堿基的氫鍵綁定,寡聚酰胺與 dsDNA 分子間的范德華力以及帶正電末端與小溝的靜電作用,共同維持 2∶1 結合復合物的穩定性。從此,寡聚酰胺分子二聚體對 dsDNA 的識別能力越來越被重視。
為了避免寡聚酰胺以非二聚體形式非特異性地結合 dsDNA,或者兩寡聚酰胺間發生相對滑動以至結合非目標 dsDNA 序列,Mrksich 等[7]采用 4-氨基丁酸(4-aminobutyric acid,γ)連接兩個寡聚酰胺的末端羧基和末端氨基,作為 “γ-turn” 形成了發卡型結構。6 環發卡型寡聚酰胺 ImPyPy-γ-PyPyPy 對目標序列的親和常數為 7.6×107(mol/L)-1,對于兩個單堿基錯配序列,親和常數降低為原來的 1/24 或 1/200。與單寡聚酰胺 PyPyPy 和 ImPyPy 相比,ImPyPy-γ-PyPyPy 對目標序列的親和常數高出 2~3 個數量級。Gottesfeld 等[2]在活細胞中檢測合成的 8 環發卡型寡聚酰胺調控基因的表達時發現,8 環發卡型寡聚酰胺綁定含 6 個堿基對的啟動子序列平衡解離常數KD約為 0.03 nmol/L, 比相應的 DNA 結合蛋白(KD≈1 nmol/L)有更高的親和力,這極大地鼓舞了研究者對 2∶1 模式的深入探索。
1.2 發卡型寡聚酰胺識別 dsDNA 的原理
發卡型寡聚酰胺對 dsDNA 堿基的識別特異性主要來源于五環結構、發卡連接分子 γ 和 3-氨基丙酸(β-alanine,β)與堿基對的特異性作用。
如圖 1 所示,堿基 A 和 G 的 N3 原子以及 T 和 C 的 C2-O 原子均帶有一對孤對電子,能和寡聚酰胺酰胺鍵上的 NH 形成氫鍵,這極大地貢獻了結合能。堿基 G 的氨基和 Py 環存在空間沖突,能和 Im 契合并與 Im 的 N3 原子形成氫鍵[8],因此 Im/Py 組合能從四種堿基對中區分出 G-C;Py/Py 組合能從四種堿基對中識別出 A-T 和 T-A,卻不能區分二者。為了區分堿基對 A-T 和 T-A,White 等[9]設計了一種新的芳香族氨基酸 Hp。如圖 1c、d所示,Hp/Py 組合能特異性地匹配 T-A 堿基對構象,并與堿基 T 中 O2 形成氫鍵。Hp/Py 組合對堿基對 T-A 的特異性識別更多地來源于對A-T親和力的降低,Hp/Py 組合與堿基對 T-A 的親和力甚至低于 Py/Py,在更多的研究應用中依然使用 Py/Py。

發卡型寡聚酰胺中,γ 具有 Py 類似的特異性:對堿基的親和順序為 A≈T>C>G,并且 γ 位置遠端的堿基特異性仍然偏好 A 和 T[10]。可能正如寡聚酰胺酰胺基的 NH 一樣,γ 轉折結構的 N 端的氨基和 A 的 N3 原子、T 的 O2 原子形成了氫鍵,但對于 G,可能存在不利的空間作用和靜電效果。在 γ 轉折結構上的修飾可以影響發卡型寡聚酰胺的結合親和力和特異性[11]、細胞透過性[12]甚至生物毒性[13-15]。將六環發卡型寡聚酰胺中 γ 轉折結構的潛手性 C2 位置上的 H 替代為 NH2,即將 γ 替換為(R)H2Nγ[11],它對目標序列的親和力是修飾前的 13 倍,特異性也進一步提升,該修飾還加強了綁定方向的特異性。Meier 等[12]在 γ 轉折結構 C3 位置修飾芳烴基,這個修飾提升了實驗中所采用的所有發卡型寡聚酰胺的細胞透過性,并且產生了不同的核內積累量上限。根據 Yang 等[13]的研究,γ 轉折結構的 C2、C3 位置分別修飾氨基或者乙酰氨基的四種八環發卡型寡聚酰胺中,在 γ 轉折結構的 C2 位置修飾了乙酰氨基的寡聚酰胺在皮下注射劑量達到 10 mg/kg 時仍沒表現出明顯的毒性。γ 轉折結構修飾的進一步研究探索將擴大寡聚酰胺應用的范圍以及安全性。
發卡型寡聚酰胺二聚體對識別目標 DNA 序列的親和力和特異性并不是隨著長度的增加而提升[6]。隨著發卡型寡聚酰胺長度增加,寡聚酰胺和 B 型 DNA(與細胞中雙螺旋 DNA 結構最接近的 dsDNA 形式)的曲率不匹配愈加凸顯,這阻礙了寡聚酰胺和小溝中堿基的氫鍵和范德華力的形成,甚至造成失配,降低了親和力;同時,這使得由 G 的氨基產生的空間位阻效應無法起作用,進一步降低了特異性[16]。將 β 引入發卡型寡聚酰胺可提升發卡型寡聚酰胺識別較長 DNA 序列的親和力和特異性[16]。β 有和 Py 類似的特異性,β/β、β/Py 和 Py/β 表現出不弱于 Py/Py 的對A-T及 T-A 的識別特異性,而 β/Im和Im/β 則分別表現出對 C-G 和 G-C 的特異性[8]。β/β 在適當的位置上取代 Py/Py,發卡型寡聚酰胺甚至能有更佳的識別效果[16]。Turner等[16]認為,在發卡型寡聚酰胺序列中,β 的柔軟特性有助于發卡型寡聚酰胺將氫鍵形成位點調整到對應的堿基位置上,緩解了二聚體聚酰胺和 DNA 的曲率的不匹配。甚至,連續的兩個 ββ 連接在發卡型寡聚酰胺 N 端的非核心識別區域,能讓其識別親和力和特異性略有提升[17]。
發卡型寡聚酰胺二聚體中的 γ 替換為 (R)H2N γ 能為發卡型寡聚酰胺串聯提供連接位點。在保持發卡型寡聚酰胺識別 dsDNA 親和力及特異性的同時,延長識別序列[18]。Kawamoto 等[18]串聯了兩個相同的 7 環發卡型寡聚酰胺ImImPy-(R)H2Nγ-PyPyPyIm-β-Dp(Dp: dimethylaminopropylamine,3-二甲氨基丙胺)識別含 12 個堿基對的 DNA 序列。該復合物的熱熔解溫度(Tm值)達到 69.7 ℃,比單純的 dsDNA 序列 Tm 值高 26 ℃。對單個和兩個錯配序列復合,Tm 值分別下降約 7 ℃ 和 14 ℃。2015 年,他們[19]合成了熒光標記的 3 個串聯的發卡型寡聚酰胺探針 TT59,用來識別 18 個堿基對長度的人類端粒末端重復序列(TTAGGG)3(ODN-3),這是目前為止公布的發卡型寡聚酰胺識別的最長序列。發卡型寡聚酰胺探針 TT59 能以優異的親和力(平衡解離常數KD=3.6 nmol/L)結合目標序列 ODN-3。該串聯寡聚酰胺對包含單個錯配的兩個 dsDNA 對比序列的結合親和力降低了 2/3,說明 TT59 能特異性識別 dsDNA 序列,對目標序列外的序列幾乎沒有結合,細胞毒性小。
1.3 發卡型寡聚酰胺識別 dsDNA 的缺陷
γ 與 β 在維持發卡型寡聚酰胺結構的同時,也可能帶入不利序列偏好。根據 Dervan 團隊[10]的研究,六環發卡型寡聚酰胺 ImImPy-γ-ImPyPy-β-Dp 識別 5′-W1GGCW2-3′ 序列,在 W2處,γ 識別堿基 T、A、C 的親和常數分別是識別堿基 G 的 420 倍、400 倍、15 倍以上;同時,在 W1處,β 對 A 和 T 的親和力至少是 C 和 G 的 310~210 倍。然而,γ 與 β 對 A-T和T-A 的顯著結合偏好可能會限制靶定序列范圍。
在發卡型寡聚酰胺中使用 β 的原則可能需要重新考量。和經典的報道不同的是,Bashkin 等[20]發現在 8 環發卡型寡聚酰胺 ImImPyPy-γ-PyImPyPy-β-Dp 與ImPyPyPy-γ-PyImImPy-β-Dp 中,用 β 取代其中的 Py 形成 β/Im 五環結構,將導致發卡型寡聚酰胺結合 dsDNA 平衡解離常數兩個數量級的增加以及特異性的退化。
發卡型寡聚酰胺的固有結構性問題限制了發卡型寡聚酰胺長度,并造成設計替代的五環結構的困難。過長的發卡型寡聚酰胺,其曲率遠高于 dsDNA,底部官能團與小溝堿基對距離過大,無法產生特異性作用,并且可能導致五環結構扭曲,引起失配[21]。不同于單個聚酰胺與 dsDNA 結合形成的相對柔軟體系,發卡形狀的兩條聚酰胺構象相對不自由,故一個五環結構曲率的變化對整個發卡型寡聚酰胺曲率有巨大的影響[22]。因此設計替代五環時,由于整個環的原子排布差異,面對小溝的官能團電性也是不同的,即便發卡型寡聚酰胺面對小溝側是同樣的官能團,也難以預測其性能[21]。
發卡型寡聚酰胺能以高親和力特異性結合 dsDNA 目標序列,并且易于合成,擁有良好的細胞膜透過性和細胞內穩定性,這些優秀的性質讓發卡型寡聚酰胺在基因治療(腫瘤治療、抗病毒治療)和基因編輯等領域擁有廣泛的應用潛力。目前發卡型寡聚酰胺主要有以下三種應用形式:①通過單純的發卡型寡聚酰胺結合 dsDNA,阻礙特定生理機制中蛋白質-DNA 復合物形成,具有調控基因表達、抗病毒、腫瘤治療等效用。②僅作為功能分子中 DNA 結合域,特異性結合相應序列,以實現功能基團的作用。綴以不同的功能基團,比如辛二酰基酰替苯胺異羥肟酸(suberoylanilide hydroxamic acid, SAHA)、四羥基環丙基苯并吲哚(1, 2, 9, 9a-tetrahydrocyclopropa[1, 2-c]benz[1, 2-e]indol-4-one, CBI)、維生素 C(vitamin C, Vc)等,該功能分子可以在特定基因位點完成乙酰化、烷基化、切割等作用,實現相應的生理功能。③發卡型寡聚酰胺僅連接熒光分子基團,作為熒光探針,實現特定生物信息的診斷、定位、可視化等功能。
2.1 單純發卡型寡聚酰胺結合 dsDNA
單純的發卡型寡聚酰胺結合至 dsDNA 小溝,制造小溝空間障礙或者同時引起 dsDNA 的變構扭曲來阻礙或者激活與 DNA 序列特異性結合相關的生理過程,具有治療癌癥和抗病毒的潛力[23]。
發卡型寡聚酰胺能夠結合啟動子,阻止轉錄因子與 DNA 序列的結合作用,調節轉錄因子結合活性,調節轉錄水平[1, 24-25]。10 環發卡型寡聚酰胺 PyPyImImIm-γ-PyPyPyPyIm-β-DP 可以綁定三磷酸腺苷結合盒轉運蛋白 A1(ATP-binding cassette transporter A1, ABCA1)基因啟動子區域的 AP-2 蛋白結合位點,阻礙因 AP-2 蛋白結合引發的 ABCA1 基因蛋白表達下調[25]。在 10 μmol/L 的 10 環發卡型寡聚酰胺 PyPyImImIm-γ-PyPyPyPyIm-β-DP 處理的 RAW264 細胞中,ABCA1 基因的 mRNA 表達水平提升至空白組 mRNA 表達水平的 1.9 倍,幾乎與多沙唑嗪藥劑的提升水平(是空白組的 2.2 倍)相當;同時,經凝膠滲透色譜分析,被靜脈注射發卡型寡聚酰胺的 C57B6 小鼠血漿中各種高密度脂蛋白亞組分含量都有了顯著提升[25]。Kummer 等[26]發現,在電離輻射損傷基因后,發卡型寡聚酰胺能結合 PC3 細胞裂解液中 DNA 序列 5′-WCWWCW-3′(W為A/T),阻礙 DNA 修復因子結合該序列進行修復,增加電離輻射對細胞的殺傷力。這表明發卡型寡聚酰胺有望成為放大腫瘤放射治療效果的藥劑;發卡型寡聚酰胺也可結合細胞內游離的病毒基因特殊序列,阻礙病毒基因的逆轉錄,從而阻礙病毒的復制,或者引發細胞內 DNA 損傷響應機制,清除游離基因,起到抗病毒作用[27-28];發卡型寡聚酰胺結合分裂間期的細胞 dsDNA,抑制 DNA 解旋酶活性,激活細胞周期檢查點響應,暫停細胞分裂[29]。
2.2 多功能綴合分子中 DNA 結合域
發卡型寡聚酰胺作為 DNA 結合域,可綴以相應的功能區域,如 DNA 切割劑、dsDNA 烷基化劑[30-33]或組蛋白脫乙酰酶(histone deacetylase, HDAC)抑制劑來組成相應的功能分子,進行 DNA 序列特異性的編輯修飾作用。
整合了發卡型寡聚酰胺與 DNA 烷基化劑的雙功能分子能特異性地烷基化相關基因堿基位點,造成基因功能損傷,沉默基因。這種綴合分子避免了 DNA 烷基化劑非特異性地烷基化正常基因的問題,減少了毒副作用。同時,綴以 DNA 烷基化劑后,寡聚酰胺不僅結合在啟動子能阻止特定基因的轉錄翻譯,而且也能結合在編碼區有效阻礙 mRNA 的轉錄延伸,擴大了阻礙特定基因轉錄翻譯的可作用序列范圍。Sugiyama 團隊[30-32]設計的基于發卡型寡聚酰胺的 DNA 烷基化綴合分子——發卡型寡聚酰胺-CBI,能有效特異性地烷基化致癌基因 Kras 的突變點密碼子(codon 13和condon12)以及人類端粒序列,并誘導細胞凋亡。Sugiyama 團隊[33]還設計了一種光控發卡型寡聚酰胺-CBI 烷基化劑。他們將光解基團修飾在 CBI 的苯酚羥基處,當暴露在 365 nm 紫外線(ultraviolet, UV)照射下,基團可特異性地脫除,激活 CBI 烷基化活性。實驗證明 UV 誘導激活的光控發卡型寡聚酰胺-CBI 烷基化劑能夠導致人類肺癌細胞株 A549 發生顯著的形貌改變。這些結果都展現了發卡型寡聚酰胺-DNA 烷基化劑綴合分子作為有效的癌癥化療手段的潛力。此外,發卡型寡聚酰胺-DNA 烷基化劑綴合分子阻斷轉錄的功能同樣有望應用于抗病毒藥物的研發[30]。
在癌細胞中,HDAC 往往過度表達,過強的核小體組蛋白去乙酰化,使得 DNA 和組蛋白緊緊結合,阻礙了某些腫瘤抑制基因的轉錄表達。HDAC 抑制劑能序列特異性地提高組蛋白乙酰化,增強腫瘤抑制基因表達水平,誘導癌細胞凋亡,是一種抗腫瘤藥物[34]。發卡型寡聚酰胺和一種 HDAC 抑制劑 SAHA 組裝成的發卡型寡聚酰胺-SAHA 綴合分子特異性激活基因表達的功能被應用于調節誘導多功能干細胞重編程基因的表達[35]。Pandian等[35]合成了一種發卡型寡聚酰胺-SAHA 綴合分子,顯著誘導 Oct-3/4 和 Nanog 基因轉錄因子的內源性表達。并且,這種綴合分子對 5 種基因(Oct-3/4、Nanog、Dppa4、Cdh1、Rex1)啟動子區域的結合讓它們的 H3、H3K14 位點的組蛋白乙酰化水平均超過了胚胎干細胞,而單獨使用 SAHA 幾乎不改變 H3、H3K14 位點的乙酰化水平。這顯示出基于發卡型寡聚酰胺的 HDAC 抑制劑的巨大抑制效用。
發卡型寡聚酰胺靶定目標 dsDNA 序列的高親和力和特異性也讓它能作為 DNA 切割劑的靶定區域。Li 等[36]利用發卡型寡聚酰胺連接小分子 DNA 切割劑大環多胺和 Vc,組合成新型的 dsDNA 切割綴合分子。相對于小分子 DNA 切割劑的低效性和位點的隨機性,綴合分子切割劑有顯著的速率提升以及特異性切割活性,能以更低的有效濃度和更高的特異性進行基因操控。
2.3 發卡型寡聚酰胺熒光探針
發卡型寡聚酰胺表現出優秀的 dsDNA 識別能力以及良好的核定位能力,有望成為 dsDNA 檢測探針[37]。Kawamoto 等[18]在兩個串聯的發卡型寡聚酰胺 C 端修飾 3H-吲哚菁類染料或者德克薩斯紅(Texas Red, TR)組成熒光發卡型寡聚酰胺探針,用于識別小鼠或人類端粒重復序列 5′-AGGGTT AGGGTT-3′。其中,串聯吡咯-異咪唑聚酰胺發卡(tandem hairpin pyrrole-imidazole polyamides,TH59)與 TR 組成的綴合分子 TH59TR 能在小鼠以及人類細胞中清晰地標示端粒,為細胞中端粒的特異性標記和分析提供了有效方法。隨后他們又設計了基于 3 個串聯發卡型寡聚酰胺的熒光探針,能特異性地識別 18 堿基對人類端粒重復序列,進一步擴大了識別長度[19]。此外,Vaijayanthi等[38]設計了一種新型熒光探針:熒光基團(芘)連接在 8 環發卡型寡聚酰胺的 γ 轉折結構部分。穩態熒光研究表明,結合目標序列后,相對于芘連接在發卡型寡聚酰胺 N 端的探針,新型熒光探針的熒光發射強度(386 nm)有更高的提升。用 β 連接芘和 γ 轉折結構將進一步提升新型發卡型寡聚酰胺熒光分子的結合親和力,其平衡解離常數可達1.73×10–8mol/L,有望成為有效的 DNA 熒光探針。
3 展望
發卡型寡聚酰胺是一種綁定 dsDNA 小溝的分子配體,它擁有良好的細胞膜和核膜透過性,不需要載體幫助就能進入細胞核。不同于核酸和類核酸,寡聚酰胺能完全抵抗核酸酶的降解,具有良好的細胞內穩定性。發卡型寡聚酰胺識別 dsDNA 的特異性來自于兩側五環單元與小溝堿基對的形狀特異性匹配以及五環與堿基邊緣的氫鍵結合。發卡結構的連接讓寡聚酰胺二聚體以 Im/Py 識別 G-C、Hp/Py 識別 T-A 的配對原則,組合識別小溝兩側堿基序列。8 環發卡型寡聚酰胺能以媲美 DNA 結合蛋白的親和力和優秀的特異性結合 dsDNA。這些性質吸引了大量學者致力于研究基于寡聚酰胺的基因藥物或探針,以實現對細胞內 dsDNA 序列的定向結合,并探索特定基因序列功能[39-41]。開發可被發卡型寡聚酰胺以優秀親和力特異性靶定的病理相關 dsDNA 序列,以及對具有序列特異性的發卡型寡聚酰胺的透膜吸收性[42]、生物毒性[13]等臨床性質的檢測研究將會是后續發展熱點。
引言
發卡型寡聚酰胺是一種擁有良好細胞膜、核膜通透性[1],能夠在雙鏈脫氧核糖核酸(double strand deoxyribonucleic acid,dsDNA)螺旋小溝處識別特定序列的分子配體。發卡型寡聚酰胺通過三種五環結構單元[N-甲基咪唑(N-methylimidazole,Im)、N-甲基吡咯(N-methylpyrrole,Py)、N-甲基-3-羥基吡咯(3-hydroxypyrrole,Hp)]的四種組合 Im/Py、Py/Im、Py/Py(或Hp/Py)、Py/Py(或Py/Hp)分別識 dsDNA 的 G-C、C-G、T-A 和 A-T 四種堿基對。8 環發卡型寡聚酰胺能以媲美 DNA 結合蛋白的親和力和優秀的特異性結合 dsDNA[2]。不同于天然的核酸、蛋白質,發卡型寡聚酰胺能完全抵抗核酸酶的降解,具有良好的細胞內穩定性。近年來大量研究從事發卡型寡聚酰胺在基因治療、基因調控以及基因編輯等領域的應用[3-5]。本文綜述了發卡型寡聚酰胺對 dsDNA 的識別機制及其應用研究進展。
1 發卡型寡聚酰胺識別 dsDNA
1.1 發卡型寡聚酰胺的出現
在 1992 年,Mrksich 等[6]首次使用核磁共振波譜法證實:兩條寡聚酰胺分子 ImPyPy 能特異性地以反向肩并肩的相對位置結合在同一 dsDNA 序列 5′-TGACT-3′ 的小溝。在形成的這種以 2∶1 比例結合的復合物中,兩條寡聚酰胺分子相對的芳香環能一同組合識別堿基對,并與同側 DNA 鏈堿基形成氫鍵:寡聚酰胺中酰胺基的 NH 與對應的堿基 A 的N3 原子、堿基 T 和 C 的 O2 原子形成氫鍵、堿基 G 的 NH2與Im 的 N3 形成氫鍵。兩條寡聚酰胺分子芳香環的交錯排布,酰胺鍵與堿基的氫鍵綁定,寡聚酰胺與 dsDNA 分子間的范德華力以及帶正電末端與小溝的靜電作用,共同維持 2∶1 結合復合物的穩定性。從此,寡聚酰胺分子二聚體對 dsDNA 的識別能力越來越被重視。
為了避免寡聚酰胺以非二聚體形式非特異性地結合 dsDNA,或者兩寡聚酰胺間發生相對滑動以至結合非目標 dsDNA 序列,Mrksich 等[7]采用 4-氨基丁酸(4-aminobutyric acid,γ)連接兩個寡聚酰胺的末端羧基和末端氨基,作為 “γ-turn” 形成了發卡型結構。6 環發卡型寡聚酰胺 ImPyPy-γ-PyPyPy 對目標序列的親和常數為 7.6×107(mol/L)-1,對于兩個單堿基錯配序列,親和常數降低為原來的 1/24 或 1/200。與單寡聚酰胺 PyPyPy 和 ImPyPy 相比,ImPyPy-γ-PyPyPy 對目標序列的親和常數高出 2~3 個數量級。Gottesfeld 等[2]在活細胞中檢測合成的 8 環發卡型寡聚酰胺調控基因的表達時發現,8 環發卡型寡聚酰胺綁定含 6 個堿基對的啟動子序列平衡解離常數KD約為 0.03 nmol/L, 比相應的 DNA 結合蛋白(KD≈1 nmol/L)有更高的親和力,這極大地鼓舞了研究者對 2∶1 模式的深入探索。
1.2 發卡型寡聚酰胺識別 dsDNA 的原理
發卡型寡聚酰胺對 dsDNA 堿基的識別特異性主要來源于五環結構、發卡連接分子 γ 和 3-氨基丙酸(β-alanine,β)與堿基對的特異性作用。
如圖 1 所示,堿基 A 和 G 的 N3 原子以及 T 和 C 的 C2-O 原子均帶有一對孤對電子,能和寡聚酰胺酰胺鍵上的 NH 形成氫鍵,這極大地貢獻了結合能。堿基 G 的氨基和 Py 環存在空間沖突,能和 Im 契合并與 Im 的 N3 原子形成氫鍵[8],因此 Im/Py 組合能從四種堿基對中區分出 G-C;Py/Py 組合能從四種堿基對中識別出 A-T 和 T-A,卻不能區分二者。為了區分堿基對 A-T 和 T-A,White 等[9]設計了一種新的芳香族氨基酸 Hp。如圖 1c、d所示,Hp/Py 組合能特異性地匹配 T-A 堿基對構象,并與堿基 T 中 O2 形成氫鍵。Hp/Py 組合對堿基對 T-A 的特異性識別更多地來源于對A-T親和力的降低,Hp/Py 組合與堿基對 T-A 的親和力甚至低于 Py/Py,在更多的研究應用中依然使用 Py/Py。

發卡型寡聚酰胺中,γ 具有 Py 類似的特異性:對堿基的親和順序為 A≈T>C>G,并且 γ 位置遠端的堿基特異性仍然偏好 A 和 T[10]。可能正如寡聚酰胺酰胺基的 NH 一樣,γ 轉折結構的 N 端的氨基和 A 的 N3 原子、T 的 O2 原子形成了氫鍵,但對于 G,可能存在不利的空間作用和靜電效果。在 γ 轉折結構上的修飾可以影響發卡型寡聚酰胺的結合親和力和特異性[11]、細胞透過性[12]甚至生物毒性[13-15]。將六環發卡型寡聚酰胺中 γ 轉折結構的潛手性 C2 位置上的 H 替代為 NH2,即將 γ 替換為(R)H2Nγ[11],它對目標序列的親和力是修飾前的 13 倍,特異性也進一步提升,該修飾還加強了綁定方向的特異性。Meier 等[12]在 γ 轉折結構 C3 位置修飾芳烴基,這個修飾提升了實驗中所采用的所有發卡型寡聚酰胺的細胞透過性,并且產生了不同的核內積累量上限。根據 Yang 等[13]的研究,γ 轉折結構的 C2、C3 位置分別修飾氨基或者乙酰氨基的四種八環發卡型寡聚酰胺中,在 γ 轉折結構的 C2 位置修飾了乙酰氨基的寡聚酰胺在皮下注射劑量達到 10 mg/kg 時仍沒表現出明顯的毒性。γ 轉折結構修飾的進一步研究探索將擴大寡聚酰胺應用的范圍以及安全性。
發卡型寡聚酰胺二聚體對識別目標 DNA 序列的親和力和特異性并不是隨著長度的增加而提升[6]。隨著發卡型寡聚酰胺長度增加,寡聚酰胺和 B 型 DNA(與細胞中雙螺旋 DNA 結構最接近的 dsDNA 形式)的曲率不匹配愈加凸顯,這阻礙了寡聚酰胺和小溝中堿基的氫鍵和范德華力的形成,甚至造成失配,降低了親和力;同時,這使得由 G 的氨基產生的空間位阻效應無法起作用,進一步降低了特異性[16]。將 β 引入發卡型寡聚酰胺可提升發卡型寡聚酰胺識別較長 DNA 序列的親和力和特異性[16]。β 有和 Py 類似的特異性,β/β、β/Py 和 Py/β 表現出不弱于 Py/Py 的對A-T及 T-A 的識別特異性,而 β/Im和Im/β 則分別表現出對 C-G 和 G-C 的特異性[8]。β/β 在適當的位置上取代 Py/Py,發卡型寡聚酰胺甚至能有更佳的識別效果[16]。Turner等[16]認為,在發卡型寡聚酰胺序列中,β 的柔軟特性有助于發卡型寡聚酰胺將氫鍵形成位點調整到對應的堿基位置上,緩解了二聚體聚酰胺和 DNA 的曲率的不匹配。甚至,連續的兩個 ββ 連接在發卡型寡聚酰胺 N 端的非核心識別區域,能讓其識別親和力和特異性略有提升[17]。
發卡型寡聚酰胺二聚體中的 γ 替換為 (R)H2N γ 能為發卡型寡聚酰胺串聯提供連接位點。在保持發卡型寡聚酰胺識別 dsDNA 親和力及特異性的同時,延長識別序列[18]。Kawamoto 等[18]串聯了兩個相同的 7 環發卡型寡聚酰胺ImImPy-(R)H2Nγ-PyPyPyIm-β-Dp(Dp: dimethylaminopropylamine,3-二甲氨基丙胺)識別含 12 個堿基對的 DNA 序列。該復合物的熱熔解溫度(Tm值)達到 69.7 ℃,比單純的 dsDNA 序列 Tm 值高 26 ℃。對單個和兩個錯配序列復合,Tm 值分別下降約 7 ℃ 和 14 ℃。2015 年,他們[19]合成了熒光標記的 3 個串聯的發卡型寡聚酰胺探針 TT59,用來識別 18 個堿基對長度的人類端粒末端重復序列(TTAGGG)3(ODN-3),這是目前為止公布的發卡型寡聚酰胺識別的最長序列。發卡型寡聚酰胺探針 TT59 能以優異的親和力(平衡解離常數KD=3.6 nmol/L)結合目標序列 ODN-3。該串聯寡聚酰胺對包含單個錯配的兩個 dsDNA 對比序列的結合親和力降低了 2/3,說明 TT59 能特異性識別 dsDNA 序列,對目標序列外的序列幾乎沒有結合,細胞毒性小。
1.3 發卡型寡聚酰胺識別 dsDNA 的缺陷
γ 與 β 在維持發卡型寡聚酰胺結構的同時,也可能帶入不利序列偏好。根據 Dervan 團隊[10]的研究,六環發卡型寡聚酰胺 ImImPy-γ-ImPyPy-β-Dp 識別 5′-W1GGCW2-3′ 序列,在 W2處,γ 識別堿基 T、A、C 的親和常數分別是識別堿基 G 的 420 倍、400 倍、15 倍以上;同時,在 W1處,β 對 A 和 T 的親和力至少是 C 和 G 的 310~210 倍。然而,γ 與 β 對 A-T和T-A 的顯著結合偏好可能會限制靶定序列范圍。
在發卡型寡聚酰胺中使用 β 的原則可能需要重新考量。和經典的報道不同的是,Bashkin 等[20]發現在 8 環發卡型寡聚酰胺 ImImPyPy-γ-PyImPyPy-β-Dp 與ImPyPyPy-γ-PyImImPy-β-Dp 中,用 β 取代其中的 Py 形成 β/Im 五環結構,將導致發卡型寡聚酰胺結合 dsDNA 平衡解離常數兩個數量級的增加以及特異性的退化。
發卡型寡聚酰胺的固有結構性問題限制了發卡型寡聚酰胺長度,并造成設計替代的五環結構的困難。過長的發卡型寡聚酰胺,其曲率遠高于 dsDNA,底部官能團與小溝堿基對距離過大,無法產生特異性作用,并且可能導致五環結構扭曲,引起失配[21]。不同于單個聚酰胺與 dsDNA 結合形成的相對柔軟體系,發卡形狀的兩條聚酰胺構象相對不自由,故一個五環結構曲率的變化對整個發卡型寡聚酰胺曲率有巨大的影響[22]。因此設計替代五環時,由于整個環的原子排布差異,面對小溝的官能團電性也是不同的,即便發卡型寡聚酰胺面對小溝側是同樣的官能團,也難以預測其性能[21]。
發卡型寡聚酰胺能以高親和力特異性結合 dsDNA 目標序列,并且易于合成,擁有良好的細胞膜透過性和細胞內穩定性,這些優秀的性質讓發卡型寡聚酰胺在基因治療(腫瘤治療、抗病毒治療)和基因編輯等領域擁有廣泛的應用潛力。目前發卡型寡聚酰胺主要有以下三種應用形式:①通過單純的發卡型寡聚酰胺結合 dsDNA,阻礙特定生理機制中蛋白質-DNA 復合物形成,具有調控基因表達、抗病毒、腫瘤治療等效用。②僅作為功能分子中 DNA 結合域,特異性結合相應序列,以實現功能基團的作用。綴以不同的功能基團,比如辛二酰基酰替苯胺異羥肟酸(suberoylanilide hydroxamic acid, SAHA)、四羥基環丙基苯并吲哚(1, 2, 9, 9a-tetrahydrocyclopropa[1, 2-c]benz[1, 2-e]indol-4-one, CBI)、維生素 C(vitamin C, Vc)等,該功能分子可以在特定基因位點完成乙酰化、烷基化、切割等作用,實現相應的生理功能。③發卡型寡聚酰胺僅連接熒光分子基團,作為熒光探針,實現特定生物信息的診斷、定位、可視化等功能。
2.1 單純發卡型寡聚酰胺結合 dsDNA
單純的發卡型寡聚酰胺結合至 dsDNA 小溝,制造小溝空間障礙或者同時引起 dsDNA 的變構扭曲來阻礙或者激活與 DNA 序列特異性結合相關的生理過程,具有治療癌癥和抗病毒的潛力[23]。
發卡型寡聚酰胺能夠結合啟動子,阻止轉錄因子與 DNA 序列的結合作用,調節轉錄因子結合活性,調節轉錄水平[1, 24-25]。10 環發卡型寡聚酰胺 PyPyImImIm-γ-PyPyPyPyIm-β-DP 可以綁定三磷酸腺苷結合盒轉運蛋白 A1(ATP-binding cassette transporter A1, ABCA1)基因啟動子區域的 AP-2 蛋白結合位點,阻礙因 AP-2 蛋白結合引發的 ABCA1 基因蛋白表達下調[25]。在 10 μmol/L 的 10 環發卡型寡聚酰胺 PyPyImImIm-γ-PyPyPyPyIm-β-DP 處理的 RAW264 細胞中,ABCA1 基因的 mRNA 表達水平提升至空白組 mRNA 表達水平的 1.9 倍,幾乎與多沙唑嗪藥劑的提升水平(是空白組的 2.2 倍)相當;同時,經凝膠滲透色譜分析,被靜脈注射發卡型寡聚酰胺的 C57B6 小鼠血漿中各種高密度脂蛋白亞組分含量都有了顯著提升[25]。Kummer 等[26]發現,在電離輻射損傷基因后,發卡型寡聚酰胺能結合 PC3 細胞裂解液中 DNA 序列 5′-WCWWCW-3′(W為A/T),阻礙 DNA 修復因子結合該序列進行修復,增加電離輻射對細胞的殺傷力。這表明發卡型寡聚酰胺有望成為放大腫瘤放射治療效果的藥劑;發卡型寡聚酰胺也可結合細胞內游離的病毒基因特殊序列,阻礙病毒基因的逆轉錄,從而阻礙病毒的復制,或者引發細胞內 DNA 損傷響應機制,清除游離基因,起到抗病毒作用[27-28];發卡型寡聚酰胺結合分裂間期的細胞 dsDNA,抑制 DNA 解旋酶活性,激活細胞周期檢查點響應,暫停細胞分裂[29]。
2.2 多功能綴合分子中 DNA 結合域
發卡型寡聚酰胺作為 DNA 結合域,可綴以相應的功能區域,如 DNA 切割劑、dsDNA 烷基化劑[30-33]或組蛋白脫乙酰酶(histone deacetylase, HDAC)抑制劑來組成相應的功能分子,進行 DNA 序列特異性的編輯修飾作用。
整合了發卡型寡聚酰胺與 DNA 烷基化劑的雙功能分子能特異性地烷基化相關基因堿基位點,造成基因功能損傷,沉默基因。這種綴合分子避免了 DNA 烷基化劑非特異性地烷基化正常基因的問題,減少了毒副作用。同時,綴以 DNA 烷基化劑后,寡聚酰胺不僅結合在啟動子能阻止特定基因的轉錄翻譯,而且也能結合在編碼區有效阻礙 mRNA 的轉錄延伸,擴大了阻礙特定基因轉錄翻譯的可作用序列范圍。Sugiyama 團隊[30-32]設計的基于發卡型寡聚酰胺的 DNA 烷基化綴合分子——發卡型寡聚酰胺-CBI,能有效特異性地烷基化致癌基因 Kras 的突變點密碼子(codon 13和condon12)以及人類端粒序列,并誘導細胞凋亡。Sugiyama 團隊[33]還設計了一種光控發卡型寡聚酰胺-CBI 烷基化劑。他們將光解基團修飾在 CBI 的苯酚羥基處,當暴露在 365 nm 紫外線(ultraviolet, UV)照射下,基團可特異性地脫除,激活 CBI 烷基化活性。實驗證明 UV 誘導激活的光控發卡型寡聚酰胺-CBI 烷基化劑能夠導致人類肺癌細胞株 A549 發生顯著的形貌改變。這些結果都展現了發卡型寡聚酰胺-DNA 烷基化劑綴合分子作為有效的癌癥化療手段的潛力。此外,發卡型寡聚酰胺-DNA 烷基化劑綴合分子阻斷轉錄的功能同樣有望應用于抗病毒藥物的研發[30]。
在癌細胞中,HDAC 往往過度表達,過強的核小體組蛋白去乙酰化,使得 DNA 和組蛋白緊緊結合,阻礙了某些腫瘤抑制基因的轉錄表達。HDAC 抑制劑能序列特異性地提高組蛋白乙酰化,增強腫瘤抑制基因表達水平,誘導癌細胞凋亡,是一種抗腫瘤藥物[34]。發卡型寡聚酰胺和一種 HDAC 抑制劑 SAHA 組裝成的發卡型寡聚酰胺-SAHA 綴合分子特異性激活基因表達的功能被應用于調節誘導多功能干細胞重編程基因的表達[35]。Pandian等[35]合成了一種發卡型寡聚酰胺-SAHA 綴合分子,顯著誘導 Oct-3/4 和 Nanog 基因轉錄因子的內源性表達。并且,這種綴合分子對 5 種基因(Oct-3/4、Nanog、Dppa4、Cdh1、Rex1)啟動子區域的結合讓它們的 H3、H3K14 位點的組蛋白乙酰化水平均超過了胚胎干細胞,而單獨使用 SAHA 幾乎不改變 H3、H3K14 位點的乙酰化水平。這顯示出基于發卡型寡聚酰胺的 HDAC 抑制劑的巨大抑制效用。
發卡型寡聚酰胺靶定目標 dsDNA 序列的高親和力和特異性也讓它能作為 DNA 切割劑的靶定區域。Li 等[36]利用發卡型寡聚酰胺連接小分子 DNA 切割劑大環多胺和 Vc,組合成新型的 dsDNA 切割綴合分子。相對于小分子 DNA 切割劑的低效性和位點的隨機性,綴合分子切割劑有顯著的速率提升以及特異性切割活性,能以更低的有效濃度和更高的特異性進行基因操控。
2.3 發卡型寡聚酰胺熒光探針
發卡型寡聚酰胺表現出優秀的 dsDNA 識別能力以及良好的核定位能力,有望成為 dsDNA 檢測探針[37]。Kawamoto 等[18]在兩個串聯的發卡型寡聚酰胺 C 端修飾 3H-吲哚菁類染料或者德克薩斯紅(Texas Red, TR)組成熒光發卡型寡聚酰胺探針,用于識別小鼠或人類端粒重復序列 5′-AGGGTT AGGGTT-3′。其中,串聯吡咯-異咪唑聚酰胺發卡(tandem hairpin pyrrole-imidazole polyamides,TH59)與 TR 組成的綴合分子 TH59TR 能在小鼠以及人類細胞中清晰地標示端粒,為細胞中端粒的特異性標記和分析提供了有效方法。隨后他們又設計了基于 3 個串聯發卡型寡聚酰胺的熒光探針,能特異性地識別 18 堿基對人類端粒重復序列,進一步擴大了識別長度[19]。此外,Vaijayanthi等[38]設計了一種新型熒光探針:熒光基團(芘)連接在 8 環發卡型寡聚酰胺的 γ 轉折結構部分。穩態熒光研究表明,結合目標序列后,相對于芘連接在發卡型寡聚酰胺 N 端的探針,新型熒光探針的熒光發射強度(386 nm)有更高的提升。用 β 連接芘和 γ 轉折結構將進一步提升新型發卡型寡聚酰胺熒光分子的結合親和力,其平衡解離常數可達1.73×10–8mol/L,有望成為有效的 DNA 熒光探針。
3 展望
發卡型寡聚酰胺是一種綁定 dsDNA 小溝的分子配體,它擁有良好的細胞膜和核膜透過性,不需要載體幫助就能進入細胞核。不同于核酸和類核酸,寡聚酰胺能完全抵抗核酸酶的降解,具有良好的細胞內穩定性。發卡型寡聚酰胺識別 dsDNA 的特異性來自于兩側五環單元與小溝堿基對的形狀特異性匹配以及五環與堿基邊緣的氫鍵結合。發卡結構的連接讓寡聚酰胺二聚體以 Im/Py 識別 G-C、Hp/Py 識別 T-A 的配對原則,組合識別小溝兩側堿基序列。8 環發卡型寡聚酰胺能以媲美 DNA 結合蛋白的親和力和優秀的特異性結合 dsDNA。這些性質吸引了大量學者致力于研究基于寡聚酰胺的基因藥物或探針,以實現對細胞內 dsDNA 序列的定向結合,并探索特定基因序列功能[39-41]。開發可被發卡型寡聚酰胺以優秀親和力特異性靶定的病理相關 dsDNA 序列,以及對具有序列特異性的發卡型寡聚酰胺的透膜吸收性[42]、生物毒性[13]等臨床性質的檢測研究將會是后續發展熱點。