選擇性剪接對揭示自身免疫性疾病的發病機理、診斷和治療預后具有重要意義。選擇性剪接在自身免疫性疾病中普遍存在且無偏好性,其中外顯子跳躍的剪接方式最為常見。5' 剪接、3' 剪接、外顯子數量改變、受單核苷酸多態性影響的剪接以及基因表達量差異都會影響自身免疫性疾病的發生發展,并且同一個基因的不同單核苷酸多態性可以影響多種自身免疫性疾病的發生發展。該文對不同選擇性剪接形式在不同的自身免疫性疾病中的作用進行了綜述,旨在為進一步深入研究自身免疫性疾病的不同發展階段以及不同含量剪接產物的調控機制提供一定依據。
引用本文: 周羽, 陳路, 劉新樂. 自身免疫性疾病中選擇性剪接的作用. 華西醫學, 2021, 36(8): 1132-1138. doi: 10.7507/1002-0179.202002225 復制
自身免疫性疾病是機體免疫系統功能異常導致機體攻擊自身組織的疾病,其發病機制復雜,與基因環境等有關[1]。常見的自身免疫病有系統性紅斑狼瘡、類風濕性關節炎、多發性硬化癥、干燥綜合征、重癥肌無力、1 型糖尿病和潰瘍性結腸炎等。近年來,高通量測序技術研究顯示,人類 92%~94% 的基因存在選擇性剪接,一個基因轉錄成信使 RNA(messenger RNA,mRNA)后,在選擇性剪接體的協助下可以產生多種不同結構蛋白的編碼基因,從而增加蛋白多樣性,影響疾病的發生發展[2-3]。選擇性剪接形式多樣,常見的有外顯子數量改變、5' 剪接和 3' 剪接、受單核苷酸多態性影響的剪接和基因表達量差異。在人類純化免疫細胞中開展的首次大規模多組學綜合研究結果表明,大多數基因的表達和選擇性剪接的細胞特異性是由遺傳和表觀共同協調調控的,而且對 345 個自身免疫性疾病的相關疾病位點分析顯示,某些疾病發生是由 DNA 序列或者是表觀遺傳為主導的[4]。因此,本文對近年來不同選擇性剪接形式在不同自身免疫性疾病中的作用進行了綜述,旨在為進一步了解選擇性剪接的作用機制提供依據。
1 選擇性剪接概述
真核生物的基因表達調控是一個多層次的過程,包括基因水平、轉錄水平、轉錄后水平、翻譯水平和翻譯后水平的調控。轉錄后調控是 RNA 水平上的調控,具體過程是未成熟的 mRNA 通過 5' 加帽、剪接、3' 加尾和 RNA 編輯等,最終形成成熟的 mRNA。其中選擇性剪接指的是在成熟 mRNA 形成的過程中,前體 mRNA 剪接時某些外顯子或內含子被包含或排除在最后的成熟 mRNA 中,因此由 1 個基因產生 2 條或 2 條以上的具有不同堿基序列并行使相同或不同生物學功能的轉錄本。選擇性剪接在細胞或個體的整個生命活動周期中發揮著重要作用,主要表現在影響蛋白質多樣性、細胞代謝和疾病的發生發展等方面。選擇性剪接具有多種形式,包括外顯子跨越、可變 3' 剪接位點、可變 5' 剪接位點、互斥外顯子和內含子保留。大部分選擇性剪接外顯子并不是條件選擇的結果,因此有些預測的選擇性剪接轉錄產物可能并不會被翻譯成蛋白質[5]。生物體不同組織轉錄組的選擇性剪接差異產生蛋白功能區域的缺失或者功能蛋白結構區域的不同剪接重組亞型,這些蛋白與蛋白會形成有相互聯系的生命活動網絡,這是不同選擇性剪接體存在的理論依據[6-7]。這種生命活動網絡的研究對于理解人類疾病的發病機理和易感性以及生命進化和個體發育都具有重要意義。
2 選擇性剪接的鑒定
早期選擇性剪接的鑒定方法是首先獲取樣本的轉錄本,通過逆轉錄反應獲得互補 DNA 序列,在此基礎上進行選擇性剪接事件的鑒定。隨著下一代高通量測序技術的發展,選擇性剪接事件的鑒定主要通過表達序列標簽數據、剪接區域微陣列和轉錄組測序數據分析獲得[8]。基于轉錄組測序數據分析得到的選擇性剪接事件,可以通過 Mats、Cuffdiff2、SplAdder 等操作精簡的生物信息學工具進行分析[9]。如 SplAdder 可通過轉錄組測序數據進行選擇性剪接事件鑒定或樣本間的差異分析[10]。
3 選擇性剪接的作用
選擇性剪接造成基因表達的多樣性是細胞生命活動和機體表型調節的重要手段。因此研究轉錄后 mRNA 選擇性剪接的分子機制對自身免疫性疾病的診斷、治療和預后都有重要指導意義。目前報道的自身免疫性疾病有 80 多種,其發病機制復雜,受遺傳或環境因素影響較多[11]。近年來全基因組關聯分析為這類疾病的研究提供了新思路,該方法可鑒定出成千上萬的與疾病相關的基因突變,如發生在 5' 和 3' 剪接位點的突變及外顯子和內含子剪接區域的單核苷酸多態性都會影響 mRNA 的剪接。雖然全基因組關聯分析已鑒定出很多單核苷酸多態性與復雜疾病的關聯性,但理解單核苷酸多態性功能仍面臨挑戰,因為全基因組關聯分析位點的很多突變未知,而且很難驗證單核苷酸多態性與疾病的直接相關性[12]。針對 Garfield 芯片與 10 種復雜性狀的全基因組關聯分析結果進行的富集分析顯示,內含子保留相關的單核苷酸多態性顯著富集于自身免疫性疾病[13]。而 Newman 等[14]首次研究了自身免疫性疾病患者不同淋巴細胞亞群選擇性剪接的表達差異,并與疾病基因的多樣性做了關聯分析,發現自身免疫性疾病相關基因的表達量和選擇性剪接事件較多,并且許多單核苷酸多態性與基因功能區域的剪接數量性狀基因座相關聯。此外,另有多項研究表明多種自身免疫性疾病中相關基因都發生了選擇性剪接事件[15-39],見表 1。

3.1 5' 剪接和 3' 剪接
3.1.1 系統性紅斑狼瘡
系統性紅斑狼瘡是一種多發于青年女性的累及多臟器的自身免疫性炎癥性結締組織病,其發病機制復雜,可能與Ⅰ型干擾素通路的激活有關,該通路的調控因子干擾素調節因子 5 是炎癥和免疫應答的重要轉錄因子。Graham 等[33]研究發現 rs2004640 的單核苷酸多態性可以在干擾素調節因子 5 基因的 1 號外顯子的 5'端形成 1 個剪接位點,不同的剪接產物形式發揮不同的生物學功能,而且這些不同類型的干擾素調節因子 5 是系統性紅斑狼瘡的高危遺傳因子。
3.1.2 自身免疫性甲狀腺疾病
橋本氏甲狀腺炎是婦女中常見的一種自身免疫性疾病,20%~30% 患者的發病可能與基因易感性和環境因素導致的自身免疫攻擊有關[40]。有研究顯示與 P53 同源的細胞核蛋白編碼基因 P63 通過 3' 端的選擇性剪接可以形成多種亞型,P63 的表達與橋本甲狀腺炎和甲狀腺乳頭狀癌的病理學表現相關。P63 的免疫組化分析可以檢測到 6 種亞型,在橋本甲狀腺炎患者中 P63 呈陽性,而正常的甲狀腺組織中則是陰性[34-35]。
3.1.3 重癥肌無力
重癥肌無力是神經和肌肉的接頭部位發生傳遞功能障礙的一種自身免疫性疾病。有研究顯示,細胞毒性 T 淋巴細胞相關抗原 4(cytotoxic T-lymphocyte associated antigen-4,CTLA4)在 2 號外顯子 3' 端有 1 個剪接,可以形成 LCTLA4,其在重癥肌無力患者中比較常見;此外,在重癥肌無力患者中檢測到 2 種新亞型,分別是 ssCTLA4 和 wCTLA4,但這 2 種新亞型在重癥肌無力疾病中的相關研究有限,其中 ssCTLA4 基因缺失 2 號和 3 號外顯子,wCTLA4 基因在 4 號外顯子5' 端有一個剪接位點[38]。
3.2 外顯子數量改變
3.2.1 系統性紅斑狼瘡
在系統性紅斑狼瘡疾病相關基因的研究中,C 端含有凝結素結構域的Ⅱ型跨膜蛋白分化抗原 72 對 B 細胞表面受體免疫球蛋白 G 和免疫球蛋白 M 有信號下調作用,且分化抗原 72 的多態性與系統性紅斑狼瘡的致病性相關[41-43]。有研究顯示,分化抗原 72 基因的 8 號內含子中的 13 個核苷酸有 1 個或 2 個重復和 4 個核苷酸缺失,研究表明其中具有 2 個重復可降低系統性紅斑狼瘡的患病風險[26]。這 2 種 8 號內含子改變都可以調控選擇性剪接,當選擇性剪接發生在 8 號外顯子的跳躍,9 號外顯子接著被翻譯,最終 C 端 42 個氨基酸被 49 個氨基酸替代,這種改變與鼠科系統性紅斑狼瘡相關[26]。而具有錨蛋白重復序列的 B 細胞支架蛋白 1 的選擇性剪接產物有 2 種形式,其中缺失 2 號外顯子時編碼的蛋白會缺失 1, 4, 5-三磷酸肌醇受體可能的結合區域[25]。由于具有錨蛋白重復序列的 B 細胞支架蛋白 1 在 B 細胞受體介導信號中的重要作用,具有錨蛋白重復序列的 B 細胞支架蛋白 1 結構不完整或者位點改變可能會影響重要的調控位點和功能結構域,其與系統性紅斑狼瘡的致病相關性很大;同時,具有錨蛋白重復序列的 B 細胞支架蛋白 1 基因有多個單核苷酸多態性位點,比如 rs3733197 在 7 號外顯子上由 A 突變為 T,可能影響錨蛋白模體的編碼[25]。
3.2.2 類風濕性關節炎
類風濕性關節炎相關研究也顯示,外顯子數量改變同樣影響到相關基因的生物學功能[22]。腫瘤壞死因子-α 是介導細胞免疫應答的一種強大的細胞因子,腫瘤壞死因子-α 主要通過細胞表面腫瘤壞死因子受體 1 和腫瘤壞死因子受體 2 發揮生物學功能。選擇性剪接后缺失 7 號和 8 號外顯子的腫瘤壞死因子受體 2 基因編碼的蛋白缺少跨膜區域,其選擇性剪接產物可調節腫瘤壞死因子-α 的生物學功能,并且研究顯示其在類風濕性關節炎患者血清中的含量比健康者高[22]。
3.2.3 1 型糖尿病
在 1 型糖尿病的研究中,基因發生外顯子跳躍后的剪接產物含量的變化也與其發生相關[23-24, 44]。CTLA4 與機體免疫系統調節紊亂引起的疾病有關,缺失 3 號外顯子(跨膜區域)的 CTLA4 亞型 sCTLA4 在小鼠和人類中都有表達;sCTLA4 通過增強調節性 T 細胞的功能參與系統的免疫調節活動,在轉基因小鼠中減弱 sCTLA4 基因的表達量可以加劇 1 型糖尿病的發生[24, 44]。缺失 2 號外顯子后產生的 liCTLA4 缺失了細胞外的結合區域,其 mRNA 表達水平與 1 型糖尿病模型中的非肥胖糖尿病小鼠患病風險相關[23]。
3.2.4 多發性硬化癥
在多發性硬化癥的研究中,白細胞介素-7 受體的 6 號外顯子的剪接激活與其相關[15-16]。白細胞介素-7 受體的 α 鏈分化抗原 127 有 2 種 mRNA 剪接產物形式,進而影響白細胞介素-7 受體的基因和功能蛋白表達[15]。有研究顯示,6 號外顯子的單核苷酸多態性 C/T(rs6897932)會使剪接幾率增高[45]。另一些學者的進一步研究表明,在 6 號內含子 AAUAAA 位點上的多聚腺苷酸化復合物的組裝以及 6 號外顯子較弱的 5' 端剪接位點與形成功能缺失的白細胞介素-7 受體蛋白相關[45-46]。
3.2.5 潰瘍性結腸炎
在潰瘍性結腸炎相關選擇性剪接基因的研究中,蛋白質酪氨酸磷酸酶編碼基因的 3 個單核苷酸多態性 rs886936、rs17130 和 rs8100586 位于 8 號外顯子邊緣,可以導致與免疫球蛋白類結構域關聯的 9 號外顯子的剪接,可能改變二聚體形成和配體識別,進而影響潰瘍性結腸炎的發生發展[21]。
3.3 受單核苷酸多態性影響的選擇性剪接
受單核苷酸多態性影響的選擇性剪接與自身免疫性疾病的發生有關,而且同一個基因可能與不同的自身免疫性疾病的發生相關。例如程序性死亡蛋白-1 內含子的 1 個堿基突變與歐洲人的系統性紅斑狼瘡的發生相關,程序性死亡蛋白-1 的第 1 個結合位點被單核苷酸多態性中斷,影響了位于內含子增強區的轉錄因子的結合[47]。有研究在 94 例 1 型糖尿病患者程序性死亡蛋白-1 基因測序中,發現 14 個單核苷酸多態性位點與 1 型糖尿病發生有關,其在患者中有 12.2%,而對照組只有 6.8%[48]。另外,類風濕性關節炎中也檢測出與疾病發生相關的多個程序性死亡蛋白-1 的單核苷酸多態性位點[49]。
此外,發生單核苷酸多態性位點的基因可能間接影響自身免疫性疾病中關鍵基因的選擇性剪接事件的發生。位于 13 號外顯子上的驅動蛋白輕鏈 1 編碼基因上單核苷酸多態性位點與多發性硬化癥的發生相關,而且該位點可以導致基因的選擇性剪接事件發生,產生不同功能的驅動蛋白,進一步可能降低神經膠質細胞產生的能量,從而降低髓鞘合成所需的能量[50]。激活的白細胞免疫球蛋白樣受體具有單核苷酸多態性,其也與疾病的發生相關聯。其中白細胞免疫球蛋白樣受體 A2 基因的一個單核苷酸多態性(rs2241524 G4A)位于 6 號內含子和 7 號外顯子的連接處,該突變破壞基因 3' 端剪接受體位點,導致最終編碼的白細胞免疫球蛋白樣受體 A2 亞型缺少 3 個氨基酸,并且臨床研究結果顯示這種新型的剪接產物在系統性紅斑狼瘡的發生中起重要作用[32]。
3.4 基因表達量差異
3.4.1 系統性紅斑狼瘡
系統性紅斑狼瘡的研究顯示,患者的淋巴細胞中選擇性剪接因子和剪接體組件成分的降低可能會使自身免疫抗原增加,從而間接刺激自身相應抗體產量增加[51]。可溶性的跨膜蛋白分化抗原 276 與紅細胞和血紅蛋白的含量相關,Sun 等[27]在 78 例系統性紅斑狼瘡患者的外周血中發現可溶性的跨膜蛋白分化抗原 276 表達量較健康對照者明顯降低,可以作為系統性紅斑狼瘡疾病的檢測指標和治療靶點。程序性死亡蛋白-1 是 T 細胞、B 細胞和單核細胞表面表達的免疫調控受體[52],可溶性的程序性死亡蛋白-1 分子是基因選擇性剪接的表達產物,有研究顯示在 59 例系統性紅斑狼瘡患者樣本中可溶性的程序性死亡蛋白-1 的表達量與對照組相比有明顯上升[30]。此外,單核細胞體外刺激培養研究顯示,完整的程序性死亡蛋白-1 和缺失 3 號外顯子的程序性死亡蛋白-1 基因表達量升高,表明其兩者在外周免疫耐受和自身免疫預防中有重要作用[31]。
3.4.2 甲狀腺功能亢進
甲狀腺功能亢進相關研究顯示,細胞凋亡調控分子在多種組織中都有表達,細胞凋亡調控分子 L 是細胞凋亡調控分子的配體,其中細胞凋亡調控分子可溶性形式的選擇性剪接產物和細胞凋亡調控分子 L 的相互作用可以阻止細胞程序性死亡[53-54]。其中,可溶性細胞凋亡調控分子缺少跨膜區域,在甲狀腺毒癥、毒性甲狀腺腫以及亞臨床甲狀腺功能亢進患者中含量增加,而在手術后甲狀腺功能正常的彌漫性毒性甲狀腺腫患者中含量下降[36]。
3.4.3 多發性硬化癥
炎癥、脫髓鞘和軸突變性是引起多發性硬化性臨床表現的主要病理學機制[55-56]。髓鞘抗原可誘導建立多發性硬化癥動物模型[57],這些抗原包括髓鞘堿性蛋白、蛋白脂質蛋白、髓鞘相關糖蛋白和髓鞘少突膠質細胞糖蛋白[58]。少突膠質細胞系中表達的少突膠質細胞譜系基因-髓鞘堿性蛋白和經典的髓鞘堿性蛋白的 mRNA 前體有多種選擇性剪接形式,其不同剪接產物形式的髓鞘堿性蛋白在基質金屬蛋白酶的作用下可以裂解成一系列免疫原片段,進而影響疾病發生[17]。髓鞘少突膠質細胞糖蛋白可以通過與髓鞘少突膠質細胞糖蛋白抗體結合來防止脫髓鞘發生,因此髓鞘少突膠質細胞糖蛋白的不同選擇性剪接形式影響多發性硬化癥的致病性[19]。
3.4.4 口眼干燥綜合癥
口眼干燥綜合癥是一種臨床表現為口干和眼干的慢性自身免疫性疾病,主要由唾液腺和淚腺受損累及其他外分泌腺及腺體外器官功能下降導致。黏蛋白 1 是唇腺合成的膜錨定的可溶性的黏蛋白,黏蛋白 1 具有 3 種選擇性剪接形式,比較特別的是在口眼干燥癥患者唇腺中分泌型黏蛋白 1 缺少胞內區域和跨膜區域[39]。口眼干燥癥患者的研究顯示,患者黏蛋白 1 的 mRNA 含量明顯高于健康對照者,但是黏蛋白 1 不同剪接亞型對疾病的調控機制研究尚不清楚[39, 59]。
4 小結與展望
外顯子數量改變、5' 剪接和 3' 剪接、受單核苷酸多態性影響的選擇性剪接以及基因表達量差異都會影響自身免疫性疾病的發生發展。從自身免疫性疾病中選擇性剪接的研究成果來看,剪接方式在自身免疫性疾病中普遍存在并且沒有偏好性,其中外顯子跳躍的剪接方式最為常見,逆轉錄聚合酶鏈反應仍然是基因剪接研究的常用方法。在某些自身免疫性疾病中發生選擇性剪接事件的基因較多,剪接方式多樣,如系統性紅斑狼瘡疾病中外顯子跳躍和可變 5' 剪接方式都有,且都可能是疾病發生發展的重要原因。本文關注的自身免疫性疾病研究顯示,部分自身免疫性疾病主要與剪接產物功能區域缺失相關[22-25, 39, 44]。通常發生外顯子跳躍后的基因結構不完整,可能會使疾病中相關蛋白跨膜區、與其他因子結合的區域等功能結構域被破壞;而且外顯子跳躍可能會產生一些新型的剪接產物,這些剪接產物的含量在患者和健康者中有一定差異。可變 5' 剪接產生的不同類型的剪接產物可能是疾病的高危遺傳因子,而可變 3' 剪接產生的多種亞型在患者和健康者體內有明顯差異。選擇性剪接因子和剪接產物含量高低也可能預示著自身免疫性疾病的發生。疾病相關基因的單核苷酸多態性位點可能導致選擇性剪接事件的產生或者使外顯子被剪接的幾率增高,間接影響疾病的發生發展,并且同一個基因有不同的單核苷酸多態性,與不同的自身免疫性疾病的發生發展相關。
綜上所述,不同的自身免疫性疾病相關功能基因和調控因子編碼基因剪接方面的深入研究,對揭示自身免疫性疾病的發病機理以及尋找疾病治療新靶點具有深遠的意義。但是目前選擇性剪接在自身免疫性疾病中的研究處于初級階段,其在自身免疫性疾病的不同發展階段中的情況以及基因內含子保留的選擇性剪接方式還有待進一步深入研究。此外,不同剪接產物在自身免疫性疾病患者中的表達量有差異,但有關其調控機制的研究有限,尋找顯著差異的選擇性剪接產物作為疾病治療和檢測的特定靶點可能是未來的研究方向,還需要更深入廣泛的基礎和臨床研究來探討。
自身免疫性疾病是機體免疫系統功能異常導致機體攻擊自身組織的疾病,其發病機制復雜,與基因環境等有關[1]。常見的自身免疫病有系統性紅斑狼瘡、類風濕性關節炎、多發性硬化癥、干燥綜合征、重癥肌無力、1 型糖尿病和潰瘍性結腸炎等。近年來,高通量測序技術研究顯示,人類 92%~94% 的基因存在選擇性剪接,一個基因轉錄成信使 RNA(messenger RNA,mRNA)后,在選擇性剪接體的協助下可以產生多種不同結構蛋白的編碼基因,從而增加蛋白多樣性,影響疾病的發生發展[2-3]。選擇性剪接形式多樣,常見的有外顯子數量改變、5' 剪接和 3' 剪接、受單核苷酸多態性影響的剪接和基因表達量差異。在人類純化免疫細胞中開展的首次大規模多組學綜合研究結果表明,大多數基因的表達和選擇性剪接的細胞特異性是由遺傳和表觀共同協調調控的,而且對 345 個自身免疫性疾病的相關疾病位點分析顯示,某些疾病發生是由 DNA 序列或者是表觀遺傳為主導的[4]。因此,本文對近年來不同選擇性剪接形式在不同自身免疫性疾病中的作用進行了綜述,旨在為進一步了解選擇性剪接的作用機制提供依據。
1 選擇性剪接概述
真核生物的基因表達調控是一個多層次的過程,包括基因水平、轉錄水平、轉錄后水平、翻譯水平和翻譯后水平的調控。轉錄后調控是 RNA 水平上的調控,具體過程是未成熟的 mRNA 通過 5' 加帽、剪接、3' 加尾和 RNA 編輯等,最終形成成熟的 mRNA。其中選擇性剪接指的是在成熟 mRNA 形成的過程中,前體 mRNA 剪接時某些外顯子或內含子被包含或排除在最后的成熟 mRNA 中,因此由 1 個基因產生 2 條或 2 條以上的具有不同堿基序列并行使相同或不同生物學功能的轉錄本。選擇性剪接在細胞或個體的整個生命活動周期中發揮著重要作用,主要表現在影響蛋白質多樣性、細胞代謝和疾病的發生發展等方面。選擇性剪接具有多種形式,包括外顯子跨越、可變 3' 剪接位點、可變 5' 剪接位點、互斥外顯子和內含子保留。大部分選擇性剪接外顯子并不是條件選擇的結果,因此有些預測的選擇性剪接轉錄產物可能并不會被翻譯成蛋白質[5]。生物體不同組織轉錄組的選擇性剪接差異產生蛋白功能區域的缺失或者功能蛋白結構區域的不同剪接重組亞型,這些蛋白與蛋白會形成有相互聯系的生命活動網絡,這是不同選擇性剪接體存在的理論依據[6-7]。這種生命活動網絡的研究對于理解人類疾病的發病機理和易感性以及生命進化和個體發育都具有重要意義。
2 選擇性剪接的鑒定
早期選擇性剪接的鑒定方法是首先獲取樣本的轉錄本,通過逆轉錄反應獲得互補 DNA 序列,在此基礎上進行選擇性剪接事件的鑒定。隨著下一代高通量測序技術的發展,選擇性剪接事件的鑒定主要通過表達序列標簽數據、剪接區域微陣列和轉錄組測序數據分析獲得[8]。基于轉錄組測序數據分析得到的選擇性剪接事件,可以通過 Mats、Cuffdiff2、SplAdder 等操作精簡的生物信息學工具進行分析[9]。如 SplAdder 可通過轉錄組測序數據進行選擇性剪接事件鑒定或樣本間的差異分析[10]。
3 選擇性剪接的作用
選擇性剪接造成基因表達的多樣性是細胞生命活動和機體表型調節的重要手段。因此研究轉錄后 mRNA 選擇性剪接的分子機制對自身免疫性疾病的診斷、治療和預后都有重要指導意義。目前報道的自身免疫性疾病有 80 多種,其發病機制復雜,受遺傳或環境因素影響較多[11]。近年來全基因組關聯分析為這類疾病的研究提供了新思路,該方法可鑒定出成千上萬的與疾病相關的基因突變,如發生在 5' 和 3' 剪接位點的突變及外顯子和內含子剪接區域的單核苷酸多態性都會影響 mRNA 的剪接。雖然全基因組關聯分析已鑒定出很多單核苷酸多態性與復雜疾病的關聯性,但理解單核苷酸多態性功能仍面臨挑戰,因為全基因組關聯分析位點的很多突變未知,而且很難驗證單核苷酸多態性與疾病的直接相關性[12]。針對 Garfield 芯片與 10 種復雜性狀的全基因組關聯分析結果進行的富集分析顯示,內含子保留相關的單核苷酸多態性顯著富集于自身免疫性疾病[13]。而 Newman 等[14]首次研究了自身免疫性疾病患者不同淋巴細胞亞群選擇性剪接的表達差異,并與疾病基因的多樣性做了關聯分析,發現自身免疫性疾病相關基因的表達量和選擇性剪接事件較多,并且許多單核苷酸多態性與基因功能區域的剪接數量性狀基因座相關聯。此外,另有多項研究表明多種自身免疫性疾病中相關基因都發生了選擇性剪接事件[15-39],見表 1。

3.1 5' 剪接和 3' 剪接
3.1.1 系統性紅斑狼瘡
系統性紅斑狼瘡是一種多發于青年女性的累及多臟器的自身免疫性炎癥性結締組織病,其發病機制復雜,可能與Ⅰ型干擾素通路的激活有關,該通路的調控因子干擾素調節因子 5 是炎癥和免疫應答的重要轉錄因子。Graham 等[33]研究發現 rs2004640 的單核苷酸多態性可以在干擾素調節因子 5 基因的 1 號外顯子的 5'端形成 1 個剪接位點,不同的剪接產物形式發揮不同的生物學功能,而且這些不同類型的干擾素調節因子 5 是系統性紅斑狼瘡的高危遺傳因子。
3.1.2 自身免疫性甲狀腺疾病
橋本氏甲狀腺炎是婦女中常見的一種自身免疫性疾病,20%~30% 患者的發病可能與基因易感性和環境因素導致的自身免疫攻擊有關[40]。有研究顯示與 P53 同源的細胞核蛋白編碼基因 P63 通過 3' 端的選擇性剪接可以形成多種亞型,P63 的表達與橋本甲狀腺炎和甲狀腺乳頭狀癌的病理學表現相關。P63 的免疫組化分析可以檢測到 6 種亞型,在橋本甲狀腺炎患者中 P63 呈陽性,而正常的甲狀腺組織中則是陰性[34-35]。
3.1.3 重癥肌無力
重癥肌無力是神經和肌肉的接頭部位發生傳遞功能障礙的一種自身免疫性疾病。有研究顯示,細胞毒性 T 淋巴細胞相關抗原 4(cytotoxic T-lymphocyte associated antigen-4,CTLA4)在 2 號外顯子 3' 端有 1 個剪接,可以形成 LCTLA4,其在重癥肌無力患者中比較常見;此外,在重癥肌無力患者中檢測到 2 種新亞型,分別是 ssCTLA4 和 wCTLA4,但這 2 種新亞型在重癥肌無力疾病中的相關研究有限,其中 ssCTLA4 基因缺失 2 號和 3 號外顯子,wCTLA4 基因在 4 號外顯子5' 端有一個剪接位點[38]。
3.2 外顯子數量改變
3.2.1 系統性紅斑狼瘡
在系統性紅斑狼瘡疾病相關基因的研究中,C 端含有凝結素結構域的Ⅱ型跨膜蛋白分化抗原 72 對 B 細胞表面受體免疫球蛋白 G 和免疫球蛋白 M 有信號下調作用,且分化抗原 72 的多態性與系統性紅斑狼瘡的致病性相關[41-43]。有研究顯示,分化抗原 72 基因的 8 號內含子中的 13 個核苷酸有 1 個或 2 個重復和 4 個核苷酸缺失,研究表明其中具有 2 個重復可降低系統性紅斑狼瘡的患病風險[26]。這 2 種 8 號內含子改變都可以調控選擇性剪接,當選擇性剪接發生在 8 號外顯子的跳躍,9 號外顯子接著被翻譯,最終 C 端 42 個氨基酸被 49 個氨基酸替代,這種改變與鼠科系統性紅斑狼瘡相關[26]。而具有錨蛋白重復序列的 B 細胞支架蛋白 1 的選擇性剪接產物有 2 種形式,其中缺失 2 號外顯子時編碼的蛋白會缺失 1, 4, 5-三磷酸肌醇受體可能的結合區域[25]。由于具有錨蛋白重復序列的 B 細胞支架蛋白 1 在 B 細胞受體介導信號中的重要作用,具有錨蛋白重復序列的 B 細胞支架蛋白 1 結構不完整或者位點改變可能會影響重要的調控位點和功能結構域,其與系統性紅斑狼瘡的致病相關性很大;同時,具有錨蛋白重復序列的 B 細胞支架蛋白 1 基因有多個單核苷酸多態性位點,比如 rs3733197 在 7 號外顯子上由 A 突變為 T,可能影響錨蛋白模體的編碼[25]。
3.2.2 類風濕性關節炎
類風濕性關節炎相關研究也顯示,外顯子數量改變同樣影響到相關基因的生物學功能[22]。腫瘤壞死因子-α 是介導細胞免疫應答的一種強大的細胞因子,腫瘤壞死因子-α 主要通過細胞表面腫瘤壞死因子受體 1 和腫瘤壞死因子受體 2 發揮生物學功能。選擇性剪接后缺失 7 號和 8 號外顯子的腫瘤壞死因子受體 2 基因編碼的蛋白缺少跨膜區域,其選擇性剪接產物可調節腫瘤壞死因子-α 的生物學功能,并且研究顯示其在類風濕性關節炎患者血清中的含量比健康者高[22]。
3.2.3 1 型糖尿病
在 1 型糖尿病的研究中,基因發生外顯子跳躍后的剪接產物含量的變化也與其發生相關[23-24, 44]。CTLA4 與機體免疫系統調節紊亂引起的疾病有關,缺失 3 號外顯子(跨膜區域)的 CTLA4 亞型 sCTLA4 在小鼠和人類中都有表達;sCTLA4 通過增強調節性 T 細胞的功能參與系統的免疫調節活動,在轉基因小鼠中減弱 sCTLA4 基因的表達量可以加劇 1 型糖尿病的發生[24, 44]。缺失 2 號外顯子后產生的 liCTLA4 缺失了細胞外的結合區域,其 mRNA 表達水平與 1 型糖尿病模型中的非肥胖糖尿病小鼠患病風險相關[23]。
3.2.4 多發性硬化癥
在多發性硬化癥的研究中,白細胞介素-7 受體的 6 號外顯子的剪接激活與其相關[15-16]。白細胞介素-7 受體的 α 鏈分化抗原 127 有 2 種 mRNA 剪接產物形式,進而影響白細胞介素-7 受體的基因和功能蛋白表達[15]。有研究顯示,6 號外顯子的單核苷酸多態性 C/T(rs6897932)會使剪接幾率增高[45]。另一些學者的進一步研究表明,在 6 號內含子 AAUAAA 位點上的多聚腺苷酸化復合物的組裝以及 6 號外顯子較弱的 5' 端剪接位點與形成功能缺失的白細胞介素-7 受體蛋白相關[45-46]。
3.2.5 潰瘍性結腸炎
在潰瘍性結腸炎相關選擇性剪接基因的研究中,蛋白質酪氨酸磷酸酶編碼基因的 3 個單核苷酸多態性 rs886936、rs17130 和 rs8100586 位于 8 號外顯子邊緣,可以導致與免疫球蛋白類結構域關聯的 9 號外顯子的剪接,可能改變二聚體形成和配體識別,進而影響潰瘍性結腸炎的發生發展[21]。
3.3 受單核苷酸多態性影響的選擇性剪接
受單核苷酸多態性影響的選擇性剪接與自身免疫性疾病的發生有關,而且同一個基因可能與不同的自身免疫性疾病的發生相關。例如程序性死亡蛋白-1 內含子的 1 個堿基突變與歐洲人的系統性紅斑狼瘡的發生相關,程序性死亡蛋白-1 的第 1 個結合位點被單核苷酸多態性中斷,影響了位于內含子增強區的轉錄因子的結合[47]。有研究在 94 例 1 型糖尿病患者程序性死亡蛋白-1 基因測序中,發現 14 個單核苷酸多態性位點與 1 型糖尿病發生有關,其在患者中有 12.2%,而對照組只有 6.8%[48]。另外,類風濕性關節炎中也檢測出與疾病發生相關的多個程序性死亡蛋白-1 的單核苷酸多態性位點[49]。
此外,發生單核苷酸多態性位點的基因可能間接影響自身免疫性疾病中關鍵基因的選擇性剪接事件的發生。位于 13 號外顯子上的驅動蛋白輕鏈 1 編碼基因上單核苷酸多態性位點與多發性硬化癥的發生相關,而且該位點可以導致基因的選擇性剪接事件發生,產生不同功能的驅動蛋白,進一步可能降低神經膠質細胞產生的能量,從而降低髓鞘合成所需的能量[50]。激活的白細胞免疫球蛋白樣受體具有單核苷酸多態性,其也與疾病的發生相關聯。其中白細胞免疫球蛋白樣受體 A2 基因的一個單核苷酸多態性(rs2241524 G4A)位于 6 號內含子和 7 號外顯子的連接處,該突變破壞基因 3' 端剪接受體位點,導致最終編碼的白細胞免疫球蛋白樣受體 A2 亞型缺少 3 個氨基酸,并且臨床研究結果顯示這種新型的剪接產物在系統性紅斑狼瘡的發生中起重要作用[32]。
3.4 基因表達量差異
3.4.1 系統性紅斑狼瘡
系統性紅斑狼瘡的研究顯示,患者的淋巴細胞中選擇性剪接因子和剪接體組件成分的降低可能會使自身免疫抗原增加,從而間接刺激自身相應抗體產量增加[51]。可溶性的跨膜蛋白分化抗原 276 與紅細胞和血紅蛋白的含量相關,Sun 等[27]在 78 例系統性紅斑狼瘡患者的外周血中發現可溶性的跨膜蛋白分化抗原 276 表達量較健康對照者明顯降低,可以作為系統性紅斑狼瘡疾病的檢測指標和治療靶點。程序性死亡蛋白-1 是 T 細胞、B 細胞和單核細胞表面表達的免疫調控受體[52],可溶性的程序性死亡蛋白-1 分子是基因選擇性剪接的表達產物,有研究顯示在 59 例系統性紅斑狼瘡患者樣本中可溶性的程序性死亡蛋白-1 的表達量與對照組相比有明顯上升[30]。此外,單核細胞體外刺激培養研究顯示,完整的程序性死亡蛋白-1 和缺失 3 號外顯子的程序性死亡蛋白-1 基因表達量升高,表明其兩者在外周免疫耐受和自身免疫預防中有重要作用[31]。
3.4.2 甲狀腺功能亢進
甲狀腺功能亢進相關研究顯示,細胞凋亡調控分子在多種組織中都有表達,細胞凋亡調控分子 L 是細胞凋亡調控分子的配體,其中細胞凋亡調控分子可溶性形式的選擇性剪接產物和細胞凋亡調控分子 L 的相互作用可以阻止細胞程序性死亡[53-54]。其中,可溶性細胞凋亡調控分子缺少跨膜區域,在甲狀腺毒癥、毒性甲狀腺腫以及亞臨床甲狀腺功能亢進患者中含量增加,而在手術后甲狀腺功能正常的彌漫性毒性甲狀腺腫患者中含量下降[36]。
3.4.3 多發性硬化癥
炎癥、脫髓鞘和軸突變性是引起多發性硬化性臨床表現的主要病理學機制[55-56]。髓鞘抗原可誘導建立多發性硬化癥動物模型[57],這些抗原包括髓鞘堿性蛋白、蛋白脂質蛋白、髓鞘相關糖蛋白和髓鞘少突膠質細胞糖蛋白[58]。少突膠質細胞系中表達的少突膠質細胞譜系基因-髓鞘堿性蛋白和經典的髓鞘堿性蛋白的 mRNA 前體有多種選擇性剪接形式,其不同剪接產物形式的髓鞘堿性蛋白在基質金屬蛋白酶的作用下可以裂解成一系列免疫原片段,進而影響疾病發生[17]。髓鞘少突膠質細胞糖蛋白可以通過與髓鞘少突膠質細胞糖蛋白抗體結合來防止脫髓鞘發生,因此髓鞘少突膠質細胞糖蛋白的不同選擇性剪接形式影響多發性硬化癥的致病性[19]。
3.4.4 口眼干燥綜合癥
口眼干燥綜合癥是一種臨床表現為口干和眼干的慢性自身免疫性疾病,主要由唾液腺和淚腺受損累及其他外分泌腺及腺體外器官功能下降導致。黏蛋白 1 是唇腺合成的膜錨定的可溶性的黏蛋白,黏蛋白 1 具有 3 種選擇性剪接形式,比較特別的是在口眼干燥癥患者唇腺中分泌型黏蛋白 1 缺少胞內區域和跨膜區域[39]。口眼干燥癥患者的研究顯示,患者黏蛋白 1 的 mRNA 含量明顯高于健康對照者,但是黏蛋白 1 不同剪接亞型對疾病的調控機制研究尚不清楚[39, 59]。
4 小結與展望
外顯子數量改變、5' 剪接和 3' 剪接、受單核苷酸多態性影響的選擇性剪接以及基因表達量差異都會影響自身免疫性疾病的發生發展。從自身免疫性疾病中選擇性剪接的研究成果來看,剪接方式在自身免疫性疾病中普遍存在并且沒有偏好性,其中外顯子跳躍的剪接方式最為常見,逆轉錄聚合酶鏈反應仍然是基因剪接研究的常用方法。在某些自身免疫性疾病中發生選擇性剪接事件的基因較多,剪接方式多樣,如系統性紅斑狼瘡疾病中外顯子跳躍和可變 5' 剪接方式都有,且都可能是疾病發生發展的重要原因。本文關注的自身免疫性疾病研究顯示,部分自身免疫性疾病主要與剪接產物功能區域缺失相關[22-25, 39, 44]。通常發生外顯子跳躍后的基因結構不完整,可能會使疾病中相關蛋白跨膜區、與其他因子結合的區域等功能結構域被破壞;而且外顯子跳躍可能會產生一些新型的剪接產物,這些剪接產物的含量在患者和健康者中有一定差異。可變 5' 剪接產生的不同類型的剪接產物可能是疾病的高危遺傳因子,而可變 3' 剪接產生的多種亞型在患者和健康者體內有明顯差異。選擇性剪接因子和剪接產物含量高低也可能預示著自身免疫性疾病的發生。疾病相關基因的單核苷酸多態性位點可能導致選擇性剪接事件的產生或者使外顯子被剪接的幾率增高,間接影響疾病的發生發展,并且同一個基因有不同的單核苷酸多態性,與不同的自身免疫性疾病的發生發展相關。
綜上所述,不同的自身免疫性疾病相關功能基因和調控因子編碼基因剪接方面的深入研究,對揭示自身免疫性疾病的發病機理以及尋找疾病治療新靶點具有深遠的意義。但是目前選擇性剪接在自身免疫性疾病中的研究處于初級階段,其在自身免疫性疾病的不同發展階段中的情況以及基因內含子保留的選擇性剪接方式還有待進一步深入研究。此外,不同剪接產物在自身免疫性疾病患者中的表達量有差異,但有關其調控機制的研究有限,尋找顯著差異的選擇性剪接產物作為疾病治療和檢測的特定靶點可能是未來的研究方向,還需要更深入廣泛的基礎和臨床研究來探討。