引用本文: 王一晨, 王瑾, 楊文山, 劉屏, 董憲喆, 胡園. 胃癌基因芯片測序與異常基因差異表達. 中國普外基礎與臨床雜志, 2020, 27(7): 790-800. doi: 10.7507/1007-9424.201910023 復制
胃癌是威脅人類健康的惡性腫瘤之一。胃癌的發生與環境、遺傳等因素有關。近年來,關于內源非編碼基因調控胃腫瘤組織發生發展過程的研究越來越受到人們的關注,與其關聯的可變剪切技術也作為當下熱點為人所關注。可變剪切系指一個前體 mRNA 通過不同的剪接方式產生多樣 mRNA 剪接異構體的過程,是產生高等真核生物蛋白質的重要分子調控機制之一。不少學者發現,可變剪接在個體發育、組織分化、腫瘤形成等過程中都發揮著十分重要的作用[1]。
本研究從胃癌樣本組織中提取相關基因產物,使用高通量基因芯片等分子技術檢測胃癌基因差異表達的可變剪接事件[2],并對結果做探討分析。
1 資料與方法
1.1 臨床資料
回顧性收集 2015 年 7 月至 2016 年 12 月期間中國人民解放軍總醫院普外科標本庫的 3 例胃癌住院患者的癌組織及癌旁組織標本,樣本經中國人民解放軍總醫院病理科檢查確證。癌旁組織取自距離腫瘤以遠 4 cm 的組織,經鑒定組織內無明顯的腫瘤細胞。所有患者術前未行放化療。所有組織標本均用 10% 中性甲醛固定,在低溫條件下做凍存處理。試驗已經過中國人民解放軍總醫院倫理委員會審批,受試患者均已簽署知情同意書。
1.2 主要試劑和設備
GeneChip WT cDNA 合成和擴增試劑盒(Affymetrix 公司,美國),GeneChip WT 終端標記試劑盒(P/N 703174 Rev 1,Affymetrix 公司,Santa Clara,CA),TRIzol 試劑(美國 Invitrogen 公司)。Agilent 2100 生物分析儀(Agilent Technologies Inc,Palo Alto,CA),Affymetrix Fluidics Station 450 和 GeneChip2 Scanner 3000 7G 微陣列掃描儀(Affymetrix 公司,美國)。
1.3 DNA 和 RNA 的提取
使用標準的氯仿程序從冷凍的腫瘤樣品中提取 DNA。使用 TRIzol 試劑從冷凍的腫瘤樣品中分離出總 RNA,并依據 Affymetrix 的建議方法,使用 GeneChip WT cDNA 合成和擴增試劑盒生成 cDNA,并在 Agilent 2100 生物分析儀上進行了質量評估。本研究總 RNA 的完整性值在 7.7 和 9.0 之間(平均值 8.65),滿足測試標準。通過 PCR 擴增基因組 DNA,對產物進行測序。
1.4 陣列雜交
使用 GeneChip WT 終端標記試劑盒對 cDNA 進行片段化和末端標記。將約 5.5 mg 標記的 DNA 靶標在 45 ℃ 下與 Affymetrix GeneChip Human Exon 1.0 ST 陣列雜交 16 h。將雜交的陣列洗滌并在 GeneChip Fluidics Station 450 上染色,之后在 GeneChip2 Scanner 3000 7G 上進行掃描。使用 140 萬個探針集的一個子集對所得的探針信號強度進行了草圖分位數歸一化。使用穩健的多陣列平均值(RMA)總結基因表達水平。為使方差穩定,增加了一個常數 16,并對匯總信號進行 log2 轉換。為避免混淆基因表達變異的解釋,本研究在總結表達前從外顯子中刪除了數據,這些外顯子的探針組包含兩個或多個帶有單核苷酸多態性(SNP)的探針。所有原始外顯子陣列數據均已保存到 Gene Expression Omnibus(GEO)中。
1.5 微陣列數據分析
本研究進行了未配對的 Student t 檢驗以比較癌組織和癌旁組織的基因強度。當倍數變化≥1.5 或 P≤0.05 時,基因表達的差異被認為存在統計學意義。首先在拼接水平上進行分析,僅考慮外顯子探針(即“EXON 分析”)。SPLICING PATTERN 分析中,未調整的 P≤0.05 和倍數變化≥1.5 時表明有統計學意義;EXON 分析中,未調整的 P≤0.05 和倍數變化≥2.0 被認為具有統計學意義[3]。對微陣列數據進行生物信息學分析后,使用 GenoSplice EASANA 界面進行手動檢查,以選擇高置信度事件。
1.6 RNA-Seq 分析
對組織樣品的 RNA 進行測序。采用 Tophat 對讀數進行比對。使用 DEXseq 對癌組織(n=3)和癌旁組織(n=3)樣品之間的差異剪接進行分析,錯誤發現率(FDR)界定值是確定事件重要性的衡量標準。GO 分析中:P<0.05 表示 GO 差異有統計學意義,以評估 GO 的顯著性水平;誤判率 FDR<0.2 是對P值準確率的判斷以及對 GO 顯著性水平的再判斷。KEGG 分析中:P<0.05 表示 pathway 差異具有統計學意義,以評估 pathway 的顯著性水平;誤判率 FDR<0.40 是對 P 值準確率的判斷和對 pathway 顯著性水平的再判斷。
1.7 統計學方法
采用 SPSS 25.0 統計學軟件進行統計學分析。采用 sigmaplot(13.0)作圖軟件做圖,P 值取負對數,–(lgP)值越大表明 P 值越小,即 GO 或 pathway 的顯著性水平越高。分類資料用百分比表示,統計方法采用配對 χ2 檢驗或 Fisher 檢驗用于確定變量之間的關聯;等級變量之間的相關性采用 Spearman 秩相關分析。檢驗水準 α=0.05。
2 結果
2.1 樣本中篩選差異基因
將癌組織與癌旁組織的基因差異水平和轉錄本差異水平比較后發現,胃癌組織存在轉錄非調控(unchanged)基因、轉錄上調(up)基因和轉錄下調(down)基因。在非調控基因信息中,總共檢測出與 ENSEMBL 數據庫基因標識一致的基因 411 個,經過整理得出可變剪接基因有 20 個:溶質載體家族 23 成員 2(SLC23A2)、周期蛋白 K(CCNK)、鉀通道亞家族 K 成員 10(KCNK10)、負伸長因子復合體 C/D(NELFCD)、結構維持染色體 4(SMC4)、視黃醇結合蛋白 2(RBP2)、核受體亞家族 5 組 A 成員 2(NR5A2)、捻同源物 1(TWIST1)、蛋白原轉化酶枯草桿菌蛋白酶(PCSK2)、Sciellin 蛋白(SCEL)、磷脂酶 CE1(PLCE1)、S100 鈣結合蛋白 A8(S100A8)、SH3 結構域激酶結合蛋白 1(SH3KBP1)、溶質載體家族 25 成員 37(SLC25A37)、鈣蛋白酶抑制蛋白(CAST)、含山梨糖和 SH3 域 2(SORBS2)、肌纖維膜關聯蛋白(SLMAP)、靠停蛋白 2(CLDN2)、鳥嘌呤核苷酸結合蛋白(G 蛋白)γ4(GNG4)和 LIM 域激酶 2(LIMK2)。在上調基因信息中,總共檢測出與ENSEMBL 數據庫的基因標識一致的差異基因 119 個,經過整理得出可變剪接基因有 33 個:含 V-set 和免疫球蛋白域 2(VSIG2)、乳腺癌擴增順序 1(BCAS1)、羥基類固醇(17β)脫氫酶 2(HSD17B2)、含 FXYD 域離子運輸調控因子 3(FXYD3)、質膜蛋白脂質(PLLP)、脂肪酸 2 羥化酶(FA2H)、TMC5(transmembrane channel-like 5)、細胞壁合成蛋白 43(CWH43)、縮膽囊肽 B 受體(CCKBR)、GDP 甘露糖 4,6 脫水酶(GMDS)、再生胰島衍生1α(REG1A)、UDP 半乳糖 4 差向異構酶(GALE)、ATP 結合家族亞家族 D 成員 3(ABCD3)、溶質載體家族 35 成員 A3(SLC35A3)、橋粒膠蛋白 2(DSC2)、高爾基膜蛋白 1(GOLM1)、絨毛蛋白樣蛋白(VILL)、泛素關聯蛋白 2(UBAP2)、膜聯蛋白 A3(ANXA3)、磷酸肌醇 3 激酶類 2 γ 肽(PIK3C2G)、雙氧化酶成熟因子 2(DUOXA2)、GATA 結合蛋白 6(GATA6)、脂鈣蛋白 2(LCN2)、趨化因子(C-C 基元)配體 28(CCL28)、G 蛋白偶聯受體 110(GPR110)、F 框和亮氨酸豐富重復蛋白 13(FBXL13)、羥基前列腺素脫氫酶 15(HPGD)、含 RAS 和 EF 手性結構(RASEF)、絲氨酸蛋白酶抑制劑 B7(SERPINB7)、纖維蛋白原 γ 鏈(FGG)、纖維蛋白原 α 鏈(FGA)、胃蛋白酶 2(GKN2)和序列相似家族 3 成員 B(FAM3B)。在下調基因信息中,總共檢測出與 ENSEMBL 數據庫的基因標識一致的差異基因 75 個,經過整理得出可變剪接基因有 16 個:人分泌型卷曲相關蛋白 1(SFRP1)、人纖維蛋白 A 相互作用蛋白 1(FILIP1)、同源 3 結構域生長因子受體與內啡肽相互作用蛋白 1(SGIP1)、羧肽酶 X(M14 家族)成員 2(CPXM2)、SSPN、膠原X,α1(COL10A1)、富含亮氨酸重復 G 蛋白偶聯受體 5(LGR5)、Ⅷ 型膠原 Α1 重組蛋白(COL8A1)、ADP 核糖基化因子 GTP 酶活化蛋白 1(ASAP1)、基質改變關聯 8(MXRA8)、WW 域結合蛋白 1-like 轉錄變體 1(WBP1L)、人激肽釋放酶-7 重組蛋白(KLK7)、鈣調蛋白 2(RCAN2)、人橋粒聯結蛋白 2(AHNAK2)、膠原蛋白 α-1(Ⅳ)鏈(COL4A1)和非典型趨化因子受體 1(ACKR1)。
2.2 上調差異表達基因結果
2.2.1 GO 分析
在 801 個上調基因 GO 分類條目中具有統計學意義的有 192 個。801 個條目對應1 176 個上調基因,具有統計學意義的 192 個條目對應 407 個上調基因。結合富集度值從 192 個具有統計學意義的分類條目中篩選出與 Gene Ontology 數據庫的 GO 索引號一致的胃癌差異表達基因條目 24 個,主要涉及小分子代謝進程、蛋白質磷酸化、蛋白質水解、細胞遷移、包含堿基的代謝過程、RNA 聚合酶 Ⅱ 催化的正性轉錄調控、細胞增殖調控、細胞遷移的正性調控、細胞蛋白質代謝過程、O-聚糖處理、細胞凋亡、自我吞噬、DNA 依賴的轉錄調控、活性氧代謝過程正性調控、緊密連接組件、翻譯后蛋白質修飾、氧化還原過程、黏多糖生物合成過程、血管生成、蛋白質靶向、黏多糖代謝過程、蛋白質去磷酸化、信號轉導和細胞黏附方面(表 1)。sigmaplot 圖結果顯示,小分子代謝進程、蛋白質磷酸化、蛋白質水解和細胞轉移幾項生物功能的顯著性最突出(圖 1a)。隨后又分析了 GO 差異基因所對應的蛋白通路,總共發現關聯性蛋白通路 14 條(圖 1b)。


a: GO 分析的sigmaplot 圖表明小分子代謝進程、蛋白質磷酸化、蛋白質水解和細胞轉移的差異性最為顯著;b:GO 分析的Strings 圖表明存在關聯性蛋白通路 14 條,其中 2 個蛋白關聯 6 條,3 個蛋白關聯 3 條,多個蛋白關聯 5 條;c:passway 分析的 sigmaplot 圖表明代謝途徑及補體和凝血級聯的差異性最為顯著;d:passway 分析的 Strings 圖表明存在關聯性蛋白通路 5 條,其中 2 個蛋白關聯 4 條,3 個蛋白關聯 1 條

a:GO 分析的 sigmaplot 圖表明細胞基質黏附、小分子代謝進程、信號轉導、凋亡進程負調控和血管生生成的差異性最為顯著;b:GO 分析的 Strings 圖表明存在多條關聯性蛋白通路,其中包括 2 個關聯蛋白 7 條,3 個關聯蛋白 1 條及若干蛋白合成的通路網路;c:passway分析的 sigmaplot 圖表明黏合連接、內質網蛋白加工和癌癥通路的差異性最為顯著;d:passway 分析的Strings 圖表明存在多條關聯性蛋白通路,其中 2 個蛋白關聯 1 條,3 個蛋白關聯 1 條及 1 條由若干蛋白合成的網絡通路
2.2.2 pathway 分析
在 130 條 pathway 上調通路中具有統計學性意義的有 12 條,從中篩選出與胃癌相關性強的通路有 6 條,主要涉及代謝途徑、補體系統、脂肪細胞因子信號通路、過氧化物酶體、蛋白質消化和吸收以及自我吞噬調控方面(表 2)。結果顯示,代謝途徑和補體系統生物功能的顯著性最突出(圖 1c)。隨后又分析了 passway 顯著性差異基因所對應的蛋白通路,總共發現關聯性蛋白通路 5 條(圖 1d)。

經上述兩種上調基因的富集分析結果發現,生物學功能與代謝通路出現吻合的基因有鞘磷脂合酶 1(SGMS1)、長鏈酰基輔酶 A 合成酶 3(ACSL3)、對氧磷酶 3(PON3)、琥珀酸脫氫酶復合體亞基 C 融入膜蛋白(SDHC)、脫氫酶/還原酶(SDR 家族)成員 9(DHRS9)、胞苷酸激酶 1(CMPK1)、3′(2′),5′二磷酸核苷酸酶 1(BPNT1)、NAD 激酶(NADK)、腺苷甲硫氨酸脫羧酶 1 人類重組蛋白(AMD1)、FGA 等,主要作用于代謝進程、脂肪細胞因子信號通路、堿基生物合成、凝固機制、脂質運輸等方面。Strings 圖所示的 GO 分析和 pathway 分析相吻合的通路有:NADK-CMPK1、2′,5′寡聚腺苷酸合成酶 1(OAS1)-S-腺苷甲硫氨酸基區域蛋白 2(RSAD2)和精脒/精胺 N1-乙酰基轉移酶 1(SAT1)-AMD1,與胃癌進程的發生發展相關聯。
2.3 下調差異表達基因結果
2.3.1 GO 分析
在 984 個下調基因的 GO 分類條目中具有統計學意義的基因有 211 個,主要與細胞粘著、血液凝固、細胞基質黏附、小分子代謝進程、信號轉導、細胞凋亡負性調控、血管再生、血小板激活、轉變生長因子受體復雜集合、細胞外基質集合等相關。984 個條目對應 1 591 個下調基因,具有統計學意義的 211 個條目對應 627 個下調基因。結合富集度值從 211 個具有統計學意義的分類條目中篩選出與 Gene Ontology 數據庫的 GO 索引號一致的胃癌差異表達基因條目 43 個(表 3)。sigmaplot 圖結果顯示,細胞基質黏附、小分子代謝進程、信號轉導、凋亡進程負調控和血管生成幾項生物功能的顯著性最突出(圖 2a)。隨后又分析了 GO 顯著性差異基因所對應的蛋白通路,發現了關聯性蛋白通路 8 條,并發現了由關鍵性蛋白形成的關聯性通路網絡(圖 2b)。

2.3.2 pathway 分析
在 161 條 pathway 下調通路中具有統計學意義者 37 條,主要與黏合連接、白細胞游出遷移、內質網蛋白加工、癌癥通路、轉化生長因子(TGF)信號通路、黏著斑、礦物質吸收、結直腸癌、胰腺癌、軸突導向、細胞周期、微絲骨架調控等有關。從 37 條具有統計學意義的下調通路中篩選出與胃癌相關性強的通路共有 19 條(表 4)。sigmaplot 圖結果顯示,黏合連接、內質網蛋白加工、癌癥通路等生物功能的顯著性最突出(圖 2c)。隨后又分析了 passway 顯著性差異基因所對應的蛋白通路,總共發現關聯性蛋白通路 2 條及 1 條由若干蛋白合成的通路網絡(圖 2d)。

通過樣本檢測,本研究發現,在上述兩種下調富集分析中出現吻合的基因有:Ras 相關的 C3 肉毒素底物 1(RAC1)、5′-核苷酸酶 (NT5E)、磷酸肌醇 3 激酶調控亞基 1(PIK3R1)、胰島素樣生長因子 1(IGF1)、基質細胞衍生因子-1(CXCL12)、促分裂原活化蛋白激酶 10(MAPK10)、蝸牛同源物 2(SNAI2)、成纖維細胞生長因子受體 1(FGFR1)、母親 DPP 同源物 4(SMAD4)、SEMA6D、鳥嘌呤核苷酸結合蛋白(G 蛋白)α 抑制活性肽 2(GNAI2)等,主要參與軸突導向、Wnt 信號通路和磷酯酰肌醇-3 激酶-絲氨酸/蘇氨酸激酶(PI3K-Akt)信號通路,猜測它們與胃癌的發生機制關系密切。Strings 圖所示的下調蛋白通路中,GO 和 pathway 分析相吻合的通路有:連接黏附分子 2(JAM2)-連接黏附分子 3(JAM3)通路,和以 GLI-Kruppel 家族成員 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 以及黏著斑蛋白(VCL)為主的通路網絡,進一步證明了顯著性基因之間及其與胃癌發生的關聯性。
3 討論
胃癌是世界上第 4 常見的癌癥,每年大概有 100 萬新發病例[4]。盡管在過去的 5 年中,胃癌的發病率和死亡率在全球范圍內均有所下降,但胃癌仍是癌癥相關死亡的第 3 大主要原因,位列于肺癌和結直腸癌之后[5]。腫瘤發生的直接原因是基因改變,如典型的胃癌相關基因 myc、ras、erb、hst 等突變,這些基因異常表達就會導致胃癌的發生。RNA 是基因轉錄產物,前體 mRNA 去除內含子后,外顯子以不同方式拼接形成轉錄體,這種差異性剪接過程被稱為可變剪接[6]。人類基因可變剪接的發生可能會造成蛋白質結構和功能的改變,進而造成相關疾病。許多研究者認為,真核基因的剪接調節在胃癌的發生發展中起重要作用[7]。本研究以此為切入點,通過臨床胃癌患者的組織樣本,將胃癌組和癌旁組織進行對比,檢測差異基因和可變剪接的結果,以探討胃癌的發生機制,具備一定的創新性及一定的臨床意義。
可變剪接有 5 種基本剪切形式:① 內含子保留;② 可變 5′端;③ 可變 3′端;④ 外顯子盒;⑤ 互斥外顯子[8]。剪接過程中各種影響因素高度協調,在不改變基因組序列的前提下使蛋白質表達的復雜程度極大增加[9],它對于轉錄本的多樣性具有重要的意義。剪接樣本會有 3 種結果:① 外顯子保留產物的表達量高于外顯子被剪接產物的表達量;② 外顯子保留產物的表達量低于外顯子被剪接產物的表達量;③ 外顯子保留產物的表達量與外顯子被剪接產物的表達量幾乎相同。剪接過程任意關鍵因素的突變都可能改變正常的剪接模式而得到差異轉錄體,編碼出異常蛋白[10-11]。本試驗將胃癌組織和癌旁組織做比較,分別檢測 6 個樣本的轉錄本濃度和基因信號值(取 log2),得出轉錄水平的差異倍數和置信水平。在非調控基因、上調基因和下調基因 3 種類型中分別有 20、33 和 16 個基因出現多轉錄本而并非出現單一轉錄本量值結果,則證明該基因在轉錄 RNA 時發生可變剪接。
信號通路參與癌癥的作用機制,常見的有 Wnt 信號通路、PI3K-Akt 信號通路和 Notch 信號通路。PI3K-AKT-哺乳動物雷帕霉素靶點(mTOR)信號通路在人腫瘤細胞中經常性下調,而使基因改變其組成或使細胞表面受體的上游激活[12],而 PIK3R1-AKT 通路調控多重生物進程的信號,例如細胞凋亡、代謝、增殖和發育,與胃癌相關[13-14]。有學者[13, 15]利用 RNA 干擾(RNAi)技術敲低 PIK3R1 和 AKT1 的表達后證實,其對胃腺癌 SGC7901 細胞的侵襲具有抑制作用。PI3K 與致癌基因 ras 的結合對 ras 的轉化特性至關重要[16-17]。AKT 為人第 10 號染色體缺失的磷酸酶及張力蛋白同源的基因(PTEN)-PI3K 的下游效應因子,p-AKT 是 AKT 的活化形式,其在細胞的增殖、分化和存活中扮演著重要的角色[18]。PTEN 由于其脂質磷酸酶活性而負向調節 PI3K 信號通路,從而抑制下游成分(如 AKT 和NF-κB)的激活,刺激癌細胞增殖和生長[19-20],PTEN 的失活將導致 AKT 的異常活化。有研究[21-23]證實,核苷酸還原酶(RRM1)與 PI3K-Akt 通路的 PTEN 下調相關,進而引發代謝抑制。mTOR 位于 PI3K-AKT-mTOR 信號通路的下游,活化后通過介導下游重要信號分子而影響細胞增殖并抑制細胞凋亡,在多種惡性腫瘤中發現 mTOR 呈高表達。Wnt 信號通路是一組由蛋白質組成的信號轉導通路,通過細胞表面受體將信號傳遞到細胞中[24],最初用來描述脊椎動物和非脊椎動物的胚胎發育,隨后發現,非正常的 Wnt/β-catenin 通路的激活涉及到各種人類的多種不同類型的腫瘤發展[25-26]。Wnt 家族蛋白成員,如 Wnt1、Wnt2 和 Wnt2B 被發現在胃癌組織中呈表達上調狀態。關于該信號通路參與胃癌發生的機制可能是,通路過度表達破壞了正常胃黏膜的增殖、干細胞維持和穩態,導致胃腸上皮細胞的細胞增殖、細胞周期阻滯和細胞遷移之間出現失平衡,RAC1 作為中間環節也在其中發揮作用[27-28]。Notch 信號通路參與細胞增殖、分化、凋亡、干細胞維持等多個過程,在胃癌發生中 Notch 信號通路的激活不僅可以促進胃癌細胞增殖,抑制胃癌細胞凋亡,還能增加胃癌細胞的遷移性和侵襲性,在一定程度上加速了胃癌的進展[29]。
本研究檢測結果發現,主要上調通路有 3 條:NADK-CMPK1、OAS1-RSAD2 和 SAT1-AMD1。其中,SAT1-AMD1 通路中的 AMD1 基因主要通過催化S-腺苷甲硫氨酸脫羧產生脫羧 S-腺苷甲硫氨酸。與癌旁組織相比,AMD1 在胃癌組織中的表達明顯上調且 AMD1 高表達與腫瘤直徑和腫瘤浸潤深度密切相關(P<0.05),提示 AMD1 與胃癌的發生和發展密切相關[30]。而經證實,CMPK1 在非小細胞肺癌(NSCLC)進展中產生作用,可作為 NSCLC 治療的靶點之一[31]。OAS 是 IFN 或病毒誘導的蛋白質家族之一,它能調節巨噬細胞中宿主的先天免疫信號,從而在病毒感染過程的信號通路中發揮作用,比如抵抗黃病毒、西尼羅河病毒、登革熱病毒等[32]。RSAD2 在三陰性乳腺癌中表達上調,并且被用作預后預測因子[33]。
本研究檢測結果還發現,主要下調通路有 JAM2-JAM3,和以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 為主的關系網絡。其中,IGF1 介導的信號傳導控制著胃癌中的許多生物學過程。IGF1-IGF1R 途徑參與了胃癌中干擾素引導跨膜蛋白 2(IFITM2)表達的上調。轉錄的信號轉導活化蛋白質 3(STAT3)是由 IGF1-IGF1R 信號傳導激活的轉錄因子。磷酸化 STAT3 促進細胞存活和增殖、細胞周期進程、血管生成和轉移,在胃癌啟動和進展中承擔重要作用[34]。IGF1R 是受體酪氨酸激酶的胰島素受體家族的成員,它與底物途徑蛋白例如 mTOR 的上調與胃癌期間對化學療法的不良反應和不良預后密切相關,并且 IGF1R 信號傳導途徑的異常與胃癌期間耐藥性和化療反應差也有緊密關聯[35]。FGFR1 屬于受體酪氨酸激酶,參與多種生物學功能,如細胞增殖、存活、遷移和分化。FGFR1 在許多不同的細胞類型中表達,它的擴增與食管癌、乳腺癌和鱗狀細胞肺癌的生存率低有關[36]。與正常 GES-1 細胞相比,所有胃癌細胞系中 FGFR1 mRNA 及其蛋白的表達水平均顯著上調[37],并且它們的表達與不良的生存預后、轉移和 TNM 分期相關,表明 FGFR1 在胃癌的發生中起關鍵作用。SNAI2 位于 8 號染色體,又被稱作 slug 基因,經實驗證明,SNAI2 mRNA 的表達量在分化越低的胃癌組織中越高,不同分化胃癌組織的陽性表達率隨著分化程度降低而增加,癌組織的陽性表達率要高于正常胃黏膜[38]。在人類中,Rho GTP 酶(Rho GTPase)家族包含 20 個 Rho 小 G 蛋白,可分為 Cdc42 亞組、Rac 亞組、Rho 亞組和其他不太具備特征的亞組[39]。Rho GTP 酶所屬的 RAC1 功能十分復雜,參與腫瘤血管生成、細胞骨架組建和惡性細胞的多樣功能當中,它過度活化和過度表達似乎與侵襲性生長和其他惡性特征相關[40],還涉及到 PI3K-Akt、JNK/SAPK 信號通路活化的多種相關生物功能鏈[41-43]。CXCL 是一類能夠趨化細胞定向移動的分泌蛋白,它可以在結腸癌、肝癌、宮頸癌等惡性腫瘤中高表達,由癌相關成纖維細胞(CAFs)激活趨化因子 CXCL12/CXCL12 的特異受體(CXCR4)后,介導整合素 b1 聚集在細胞表面并促進胃癌細胞的侵襲[44],高表達 CXCL12 與 IGF1 的胃癌組織生長速度更高、轉移能力更強且腫瘤發展更快[45-46]。此外,CXCL12 還在癌細胞或微環境細胞上過度表達,通過 CXCR4 誘導巨噬細胞在瘤內微環境的遷移,也與腫瘤組織缺氧條件下的血管生成有關[47],說明 CXCL12 對這些腫瘤的增殖和轉移具有促進作用。SMAD4 是轉化生長因子 β(TGF-β)信號通路中的一個重要分子。有研究[48]證實,SMAD4 能夠提高胰腺癌細胞的遷移以及侵襲能力,表明它在胰腺腫瘤形成過程中能發揮作用。在胃癌方面,SMAD4 的高甲基化相對罕見,但 SMAD4 作為腫瘤抑制蛋白在細胞核中發揮的作用卻不容忽視[49-50],它是關鍵的預后因素。各種機制包括:核質穿梭的失調、雜合性缺失(LOH)的下調、高甲基化或蛋白酶體降解,都參與了胃癌中 SMAD4 的缺失。GLI3 是3 種 GLI 轉錄因子(GLI1、GLI2 和 GLI3)中的一種,在經典 Hedgehog(HH)信號通路中起重要作用。人 GLI3 由 15 個外顯子構建,編碼由 1 580 個氨基酸組成的蛋白質。GLI3 功能結構域包含 N 末端轉錄抑制因子、5 個鋅指(介導 DNA 結合)、蛋白酶切割位點、CBP 結合區、兩個 C 末端轉錄激活區和 α-螺旋區域[51],可以作為轉錄激活因子或抑制劑起作用[52]。GLI3 不僅在肝纖維化中發揮作用[53],而且在 NSCLC 癌組織中其蛋白表達水平高于癌旁組織,它對 NSCLC 病情的發展具有重要的促進作用[54]。多種致癌途徑增加 GLI 功能(非經典激活),包括 K-ras、PI3K/Akt 和 TGF-β,有助于腫瘤的發展和形成。MAPK10 是 MAPK 基因家族的成員,已經發現,MAPK 信號傳導途徑參與細胞發育、應激反應和其他細胞過程[55]。有研究[56]發現,MAPK10 可能受 miR-21 調控,從而調節乳腺癌的增殖和遷移并抑制乳腺癌細胞的凋亡。GNAI2 在免疫細胞中大量表達,參與 G 蛋白偶聯受體(GPCR)和非 GPCR 信號通路[57]。細胞環境可以使得 GNAI2 作為腫瘤抑制劑起作用,它也被證明是卵巢癌的診斷指標[58]。PI3K 信號傳導是幾種人類癌癥(包括結直腸癌)中最常被下調的途徑之一,也是最為有吸引力的治療靶點[59]。PIK3CA 和 AKT1 熱點突變是肛門生殖器區域的良性疾病—鞘膜炎(HP)中最常見的遺傳畸變,已鑒定 PIK3CA 和 PIK3R1 突變導致組成型激活的 PI3K/AKT 信號轉導[60]。磷酸肌醇-3-激酶調節亞基 1(PIK3R1)是 PI3K 信號傳導的組分,有研究發現,PIK3R1 軸能被下調的 circAKT3 靶向從而有效地增強 GC 細胞對小劑量順鉑(CDDP)的敏感性[61],另外 PIK3R1 在 CDDP 抗性卵巢癌細胞中高表達,它還是胰腺癌預后的臨床生物標志物[62]。VCL 被稱為肌動蛋白絲結合蛋白,參與細胞-基質黏附和細胞-細胞黏附,它調節細胞表面的 E 鈣黏蛋白表達,并通過 E 鈣黏蛋白復合物增強機械傳感[63]。VCL 也可能在細胞形態和運動中發揮重要作用。由 VCL 組成的復合物可用于將肌動蛋白絲錨定到膜上。VCL 在前列腺癌(PCa)細胞中高表達,在 PCa 細胞遷移中起關鍵作用[64]。這些基因表達蛋白被證實參與不同腫瘤的形成與發展,從獲得的實驗結果推測它們也參與胃癌發生的進程。
綜上,本研究運用基因芯片技術證實,提取的臨床胃癌樣本組織中存在著大量差異可變剪接轉錄本,它們的存在可能與原癌基因的激活、抑癌基因的突變、缺失以及細胞凋亡機制紊亂相關。利用基因富集分析,本研究篩選出來 NADK-CMPK1、OAS1-RSAD2、SAT1-AMD1 和 JAM2-JAM3 基因通路,以及以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 為主的基因通路網絡,這些經檢測有顯著差異性的基因,與胃腫瘤代謝密切關聯。基因在轉錄過程中可能涉及到 RNA 可變剪接,從而導致蛋白質異常表達。對于個別基因的具體研究還應結合它所可能聯系的相關生物學功能、信號通路等一并分析,以作出全面系統的概括。長鏈非編碼 RNA(LncRNA)作為 ncRNA 的重要組成部分,參與人體生理功能的調節;miRNA 作為復雜調控系統中必不可少的信號分子,與 LncRNA 相互作用并參與到可變剪接過程中。探索剪接體在腫瘤組織的變化模式并在癌前良性病變階段研發能對特定基因結構與功能進行檢測的生物標志物,從而為胃癌高危患者進行預警,繼而提供確鑿診斷依據,是今后胃癌相關診治的一個前景,也需要我們開展更深層次的研究來進一步證實。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:王一晨,數據統計分析和文章撰寫;王瑾,樣本收集和質檢;楊文山,協助分析;劉屏,技術指導和質控;董憲喆,研究方案設計和文章修校;胡園,文章修校。
倫理聲明:本研究已通過中國人民解放軍總醫院的倫理審核批準(批準文號:總 2015006)。
胃癌是威脅人類健康的惡性腫瘤之一。胃癌的發生與環境、遺傳等因素有關。近年來,關于內源非編碼基因調控胃腫瘤組織發生發展過程的研究越來越受到人們的關注,與其關聯的可變剪切技術也作為當下熱點為人所關注。可變剪切系指一個前體 mRNA 通過不同的剪接方式產生多樣 mRNA 剪接異構體的過程,是產生高等真核生物蛋白質的重要分子調控機制之一。不少學者發現,可變剪接在個體發育、組織分化、腫瘤形成等過程中都發揮著十分重要的作用[1]。
本研究從胃癌樣本組織中提取相關基因產物,使用高通量基因芯片等分子技術檢測胃癌基因差異表達的可變剪接事件[2],并對結果做探討分析。
1 資料與方法
1.1 臨床資料
回顧性收集 2015 年 7 月至 2016 年 12 月期間中國人民解放軍總醫院普外科標本庫的 3 例胃癌住院患者的癌組織及癌旁組織標本,樣本經中國人民解放軍總醫院病理科檢查確證。癌旁組織取自距離腫瘤以遠 4 cm 的組織,經鑒定組織內無明顯的腫瘤細胞。所有患者術前未行放化療。所有組織標本均用 10% 中性甲醛固定,在低溫條件下做凍存處理。試驗已經過中國人民解放軍總醫院倫理委員會審批,受試患者均已簽署知情同意書。
1.2 主要試劑和設備
GeneChip WT cDNA 合成和擴增試劑盒(Affymetrix 公司,美國),GeneChip WT 終端標記試劑盒(P/N 703174 Rev 1,Affymetrix 公司,Santa Clara,CA),TRIzol 試劑(美國 Invitrogen 公司)。Agilent 2100 生物分析儀(Agilent Technologies Inc,Palo Alto,CA),Affymetrix Fluidics Station 450 和 GeneChip2 Scanner 3000 7G 微陣列掃描儀(Affymetrix 公司,美國)。
1.3 DNA 和 RNA 的提取
使用標準的氯仿程序從冷凍的腫瘤樣品中提取 DNA。使用 TRIzol 試劑從冷凍的腫瘤樣品中分離出總 RNA,并依據 Affymetrix 的建議方法,使用 GeneChip WT cDNA 合成和擴增試劑盒生成 cDNA,并在 Agilent 2100 生物分析儀上進行了質量評估。本研究總 RNA 的完整性值在 7.7 和 9.0 之間(平均值 8.65),滿足測試標準。通過 PCR 擴增基因組 DNA,對產物進行測序。
1.4 陣列雜交
使用 GeneChip WT 終端標記試劑盒對 cDNA 進行片段化和末端標記。將約 5.5 mg 標記的 DNA 靶標在 45 ℃ 下與 Affymetrix GeneChip Human Exon 1.0 ST 陣列雜交 16 h。將雜交的陣列洗滌并在 GeneChip Fluidics Station 450 上染色,之后在 GeneChip2 Scanner 3000 7G 上進行掃描。使用 140 萬個探針集的一個子集對所得的探針信號強度進行了草圖分位數歸一化。使用穩健的多陣列平均值(RMA)總結基因表達水平。為使方差穩定,增加了一個常數 16,并對匯總信號進行 log2 轉換。為避免混淆基因表達變異的解釋,本研究在總結表達前從外顯子中刪除了數據,這些外顯子的探針組包含兩個或多個帶有單核苷酸多態性(SNP)的探針。所有原始外顯子陣列數據均已保存到 Gene Expression Omnibus(GEO)中。
1.5 微陣列數據分析
本研究進行了未配對的 Student t 檢驗以比較癌組織和癌旁組織的基因強度。當倍數變化≥1.5 或 P≤0.05 時,基因表達的差異被認為存在統計學意義。首先在拼接水平上進行分析,僅考慮外顯子探針(即“EXON 分析”)。SPLICING PATTERN 分析中,未調整的 P≤0.05 和倍數變化≥1.5 時表明有統計學意義;EXON 分析中,未調整的 P≤0.05 和倍數變化≥2.0 被認為具有統計學意義[3]。對微陣列數據進行生物信息學分析后,使用 GenoSplice EASANA 界面進行手動檢查,以選擇高置信度事件。
1.6 RNA-Seq 分析
對組織樣品的 RNA 進行測序。采用 Tophat 對讀數進行比對。使用 DEXseq 對癌組織(n=3)和癌旁組織(n=3)樣品之間的差異剪接進行分析,錯誤發現率(FDR)界定值是確定事件重要性的衡量標準。GO 分析中:P<0.05 表示 GO 差異有統計學意義,以評估 GO 的顯著性水平;誤判率 FDR<0.2 是對P值準確率的判斷以及對 GO 顯著性水平的再判斷。KEGG 分析中:P<0.05 表示 pathway 差異具有統計學意義,以評估 pathway 的顯著性水平;誤判率 FDR<0.40 是對 P 值準確率的判斷和對 pathway 顯著性水平的再判斷。
1.7 統計學方法
采用 SPSS 25.0 統計學軟件進行統計學分析。采用 sigmaplot(13.0)作圖軟件做圖,P 值取負對數,–(lgP)值越大表明 P 值越小,即 GO 或 pathway 的顯著性水平越高。分類資料用百分比表示,統計方法采用配對 χ2 檢驗或 Fisher 檢驗用于確定變量之間的關聯;等級變量之間的相關性采用 Spearman 秩相關分析。檢驗水準 α=0.05。
2 結果
2.1 樣本中篩選差異基因
將癌組織與癌旁組織的基因差異水平和轉錄本差異水平比較后發現,胃癌組織存在轉錄非調控(unchanged)基因、轉錄上調(up)基因和轉錄下調(down)基因。在非調控基因信息中,總共檢測出與 ENSEMBL 數據庫基因標識一致的基因 411 個,經過整理得出可變剪接基因有 20 個:溶質載體家族 23 成員 2(SLC23A2)、周期蛋白 K(CCNK)、鉀通道亞家族 K 成員 10(KCNK10)、負伸長因子復合體 C/D(NELFCD)、結構維持染色體 4(SMC4)、視黃醇結合蛋白 2(RBP2)、核受體亞家族 5 組 A 成員 2(NR5A2)、捻同源物 1(TWIST1)、蛋白原轉化酶枯草桿菌蛋白酶(PCSK2)、Sciellin 蛋白(SCEL)、磷脂酶 CE1(PLCE1)、S100 鈣結合蛋白 A8(S100A8)、SH3 結構域激酶結合蛋白 1(SH3KBP1)、溶質載體家族 25 成員 37(SLC25A37)、鈣蛋白酶抑制蛋白(CAST)、含山梨糖和 SH3 域 2(SORBS2)、肌纖維膜關聯蛋白(SLMAP)、靠停蛋白 2(CLDN2)、鳥嘌呤核苷酸結合蛋白(G 蛋白)γ4(GNG4)和 LIM 域激酶 2(LIMK2)。在上調基因信息中,總共檢測出與ENSEMBL 數據庫的基因標識一致的差異基因 119 個,經過整理得出可變剪接基因有 33 個:含 V-set 和免疫球蛋白域 2(VSIG2)、乳腺癌擴增順序 1(BCAS1)、羥基類固醇(17β)脫氫酶 2(HSD17B2)、含 FXYD 域離子運輸調控因子 3(FXYD3)、質膜蛋白脂質(PLLP)、脂肪酸 2 羥化酶(FA2H)、TMC5(transmembrane channel-like 5)、細胞壁合成蛋白 43(CWH43)、縮膽囊肽 B 受體(CCKBR)、GDP 甘露糖 4,6 脫水酶(GMDS)、再生胰島衍生1α(REG1A)、UDP 半乳糖 4 差向異構酶(GALE)、ATP 結合家族亞家族 D 成員 3(ABCD3)、溶質載體家族 35 成員 A3(SLC35A3)、橋粒膠蛋白 2(DSC2)、高爾基膜蛋白 1(GOLM1)、絨毛蛋白樣蛋白(VILL)、泛素關聯蛋白 2(UBAP2)、膜聯蛋白 A3(ANXA3)、磷酸肌醇 3 激酶類 2 γ 肽(PIK3C2G)、雙氧化酶成熟因子 2(DUOXA2)、GATA 結合蛋白 6(GATA6)、脂鈣蛋白 2(LCN2)、趨化因子(C-C 基元)配體 28(CCL28)、G 蛋白偶聯受體 110(GPR110)、F 框和亮氨酸豐富重復蛋白 13(FBXL13)、羥基前列腺素脫氫酶 15(HPGD)、含 RAS 和 EF 手性結構(RASEF)、絲氨酸蛋白酶抑制劑 B7(SERPINB7)、纖維蛋白原 γ 鏈(FGG)、纖維蛋白原 α 鏈(FGA)、胃蛋白酶 2(GKN2)和序列相似家族 3 成員 B(FAM3B)。在下調基因信息中,總共檢測出與 ENSEMBL 數據庫的基因標識一致的差異基因 75 個,經過整理得出可變剪接基因有 16 個:人分泌型卷曲相關蛋白 1(SFRP1)、人纖維蛋白 A 相互作用蛋白 1(FILIP1)、同源 3 結構域生長因子受體與內啡肽相互作用蛋白 1(SGIP1)、羧肽酶 X(M14 家族)成員 2(CPXM2)、SSPN、膠原X,α1(COL10A1)、富含亮氨酸重復 G 蛋白偶聯受體 5(LGR5)、Ⅷ 型膠原 Α1 重組蛋白(COL8A1)、ADP 核糖基化因子 GTP 酶活化蛋白 1(ASAP1)、基質改變關聯 8(MXRA8)、WW 域結合蛋白 1-like 轉錄變體 1(WBP1L)、人激肽釋放酶-7 重組蛋白(KLK7)、鈣調蛋白 2(RCAN2)、人橋粒聯結蛋白 2(AHNAK2)、膠原蛋白 α-1(Ⅳ)鏈(COL4A1)和非典型趨化因子受體 1(ACKR1)。
2.2 上調差異表達基因結果
2.2.1 GO 分析
在 801 個上調基因 GO 分類條目中具有統計學意義的有 192 個。801 個條目對應1 176 個上調基因,具有統計學意義的 192 個條目對應 407 個上調基因。結合富集度值從 192 個具有統計學意義的分類條目中篩選出與 Gene Ontology 數據庫的 GO 索引號一致的胃癌差異表達基因條目 24 個,主要涉及小分子代謝進程、蛋白質磷酸化、蛋白質水解、細胞遷移、包含堿基的代謝過程、RNA 聚合酶 Ⅱ 催化的正性轉錄調控、細胞增殖調控、細胞遷移的正性調控、細胞蛋白質代謝過程、O-聚糖處理、細胞凋亡、自我吞噬、DNA 依賴的轉錄調控、活性氧代謝過程正性調控、緊密連接組件、翻譯后蛋白質修飾、氧化還原過程、黏多糖生物合成過程、血管生成、蛋白質靶向、黏多糖代謝過程、蛋白質去磷酸化、信號轉導和細胞黏附方面(表 1)。sigmaplot 圖結果顯示,小分子代謝進程、蛋白質磷酸化、蛋白質水解和細胞轉移幾項生物功能的顯著性最突出(圖 1a)。隨后又分析了 GO 差異基因所對應的蛋白通路,總共發現關聯性蛋白通路 14 條(圖 1b)。


a: GO 分析的sigmaplot 圖表明小分子代謝進程、蛋白質磷酸化、蛋白質水解和細胞轉移的差異性最為顯著;b:GO 分析的Strings 圖表明存在關聯性蛋白通路 14 條,其中 2 個蛋白關聯 6 條,3 個蛋白關聯 3 條,多個蛋白關聯 5 條;c:passway 分析的 sigmaplot 圖表明代謝途徑及補體和凝血級聯的差異性最為顯著;d:passway 分析的 Strings 圖表明存在關聯性蛋白通路 5 條,其中 2 個蛋白關聯 4 條,3 個蛋白關聯 1 條

a:GO 分析的 sigmaplot 圖表明細胞基質黏附、小分子代謝進程、信號轉導、凋亡進程負調控和血管生生成的差異性最為顯著;b:GO 分析的 Strings 圖表明存在多條關聯性蛋白通路,其中包括 2 個關聯蛋白 7 條,3 個關聯蛋白 1 條及若干蛋白合成的通路網路;c:passway分析的 sigmaplot 圖表明黏合連接、內質網蛋白加工和癌癥通路的差異性最為顯著;d:passway 分析的Strings 圖表明存在多條關聯性蛋白通路,其中 2 個蛋白關聯 1 條,3 個蛋白關聯 1 條及 1 條由若干蛋白合成的網絡通路
2.2.2 pathway 分析
在 130 條 pathway 上調通路中具有統計學性意義的有 12 條,從中篩選出與胃癌相關性強的通路有 6 條,主要涉及代謝途徑、補體系統、脂肪細胞因子信號通路、過氧化物酶體、蛋白質消化和吸收以及自我吞噬調控方面(表 2)。結果顯示,代謝途徑和補體系統生物功能的顯著性最突出(圖 1c)。隨后又分析了 passway 顯著性差異基因所對應的蛋白通路,總共發現關聯性蛋白通路 5 條(圖 1d)。

經上述兩種上調基因的富集分析結果發現,生物學功能與代謝通路出現吻合的基因有鞘磷脂合酶 1(SGMS1)、長鏈酰基輔酶 A 合成酶 3(ACSL3)、對氧磷酶 3(PON3)、琥珀酸脫氫酶復合體亞基 C 融入膜蛋白(SDHC)、脫氫酶/還原酶(SDR 家族)成員 9(DHRS9)、胞苷酸激酶 1(CMPK1)、3′(2′),5′二磷酸核苷酸酶 1(BPNT1)、NAD 激酶(NADK)、腺苷甲硫氨酸脫羧酶 1 人類重組蛋白(AMD1)、FGA 等,主要作用于代謝進程、脂肪細胞因子信號通路、堿基生物合成、凝固機制、脂質運輸等方面。Strings 圖所示的 GO 分析和 pathway 分析相吻合的通路有:NADK-CMPK1、2′,5′寡聚腺苷酸合成酶 1(OAS1)-S-腺苷甲硫氨酸基區域蛋白 2(RSAD2)和精脒/精胺 N1-乙酰基轉移酶 1(SAT1)-AMD1,與胃癌進程的發生發展相關聯。
2.3 下調差異表達基因結果
2.3.1 GO 分析
在 984 個下調基因的 GO 分類條目中具有統計學意義的基因有 211 個,主要與細胞粘著、血液凝固、細胞基質黏附、小分子代謝進程、信號轉導、細胞凋亡負性調控、血管再生、血小板激活、轉變生長因子受體復雜集合、細胞外基質集合等相關。984 個條目對應 1 591 個下調基因,具有統計學意義的 211 個條目對應 627 個下調基因。結合富集度值從 211 個具有統計學意義的分類條目中篩選出與 Gene Ontology 數據庫的 GO 索引號一致的胃癌差異表達基因條目 43 個(表 3)。sigmaplot 圖結果顯示,細胞基質黏附、小分子代謝進程、信號轉導、凋亡進程負調控和血管生成幾項生物功能的顯著性最突出(圖 2a)。隨后又分析了 GO 顯著性差異基因所對應的蛋白通路,發現了關聯性蛋白通路 8 條,并發現了由關鍵性蛋白形成的關聯性通路網絡(圖 2b)。

2.3.2 pathway 分析
在 161 條 pathway 下調通路中具有統計學意義者 37 條,主要與黏合連接、白細胞游出遷移、內質網蛋白加工、癌癥通路、轉化生長因子(TGF)信號通路、黏著斑、礦物質吸收、結直腸癌、胰腺癌、軸突導向、細胞周期、微絲骨架調控等有關。從 37 條具有統計學意義的下調通路中篩選出與胃癌相關性強的通路共有 19 條(表 4)。sigmaplot 圖結果顯示,黏合連接、內質網蛋白加工、癌癥通路等生物功能的顯著性最突出(圖 2c)。隨后又分析了 passway 顯著性差異基因所對應的蛋白通路,總共發現關聯性蛋白通路 2 條及 1 條由若干蛋白合成的通路網絡(圖 2d)。

通過樣本檢測,本研究發現,在上述兩種下調富集分析中出現吻合的基因有:Ras 相關的 C3 肉毒素底物 1(RAC1)、5′-核苷酸酶 (NT5E)、磷酸肌醇 3 激酶調控亞基 1(PIK3R1)、胰島素樣生長因子 1(IGF1)、基質細胞衍生因子-1(CXCL12)、促分裂原活化蛋白激酶 10(MAPK10)、蝸牛同源物 2(SNAI2)、成纖維細胞生長因子受體 1(FGFR1)、母親 DPP 同源物 4(SMAD4)、SEMA6D、鳥嘌呤核苷酸結合蛋白(G 蛋白)α 抑制活性肽 2(GNAI2)等,主要參與軸突導向、Wnt 信號通路和磷酯酰肌醇-3 激酶-絲氨酸/蘇氨酸激酶(PI3K-Akt)信號通路,猜測它們與胃癌的發生機制關系密切。Strings 圖所示的下調蛋白通路中,GO 和 pathway 分析相吻合的通路有:連接黏附分子 2(JAM2)-連接黏附分子 3(JAM3)通路,和以 GLI-Kruppel 家族成員 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 以及黏著斑蛋白(VCL)為主的通路網絡,進一步證明了顯著性基因之間及其與胃癌發生的關聯性。
3 討論
胃癌是世界上第 4 常見的癌癥,每年大概有 100 萬新發病例[4]。盡管在過去的 5 年中,胃癌的發病率和死亡率在全球范圍內均有所下降,但胃癌仍是癌癥相關死亡的第 3 大主要原因,位列于肺癌和結直腸癌之后[5]。腫瘤發生的直接原因是基因改變,如典型的胃癌相關基因 myc、ras、erb、hst 等突變,這些基因異常表達就會導致胃癌的發生。RNA 是基因轉錄產物,前體 mRNA 去除內含子后,外顯子以不同方式拼接形成轉錄體,這種差異性剪接過程被稱為可變剪接[6]。人類基因可變剪接的發生可能會造成蛋白質結構和功能的改變,進而造成相關疾病。許多研究者認為,真核基因的剪接調節在胃癌的發生發展中起重要作用[7]。本研究以此為切入點,通過臨床胃癌患者的組織樣本,將胃癌組和癌旁組織進行對比,檢測差異基因和可變剪接的結果,以探討胃癌的發生機制,具備一定的創新性及一定的臨床意義。
可變剪接有 5 種基本剪切形式:① 內含子保留;② 可變 5′端;③ 可變 3′端;④ 外顯子盒;⑤ 互斥外顯子[8]。剪接過程中各種影響因素高度協調,在不改變基因組序列的前提下使蛋白質表達的復雜程度極大增加[9],它對于轉錄本的多樣性具有重要的意義。剪接樣本會有 3 種結果:① 外顯子保留產物的表達量高于外顯子被剪接產物的表達量;② 外顯子保留產物的表達量低于外顯子被剪接產物的表達量;③ 外顯子保留產物的表達量與外顯子被剪接產物的表達量幾乎相同。剪接過程任意關鍵因素的突變都可能改變正常的剪接模式而得到差異轉錄體,編碼出異常蛋白[10-11]。本試驗將胃癌組織和癌旁組織做比較,分別檢測 6 個樣本的轉錄本濃度和基因信號值(取 log2),得出轉錄水平的差異倍數和置信水平。在非調控基因、上調基因和下調基因 3 種類型中分別有 20、33 和 16 個基因出現多轉錄本而并非出現單一轉錄本量值結果,則證明該基因在轉錄 RNA 時發生可變剪接。
信號通路參與癌癥的作用機制,常見的有 Wnt 信號通路、PI3K-Akt 信號通路和 Notch 信號通路。PI3K-AKT-哺乳動物雷帕霉素靶點(mTOR)信號通路在人腫瘤細胞中經常性下調,而使基因改變其組成或使細胞表面受體的上游激活[12],而 PIK3R1-AKT 通路調控多重生物進程的信號,例如細胞凋亡、代謝、增殖和發育,與胃癌相關[13-14]。有學者[13, 15]利用 RNA 干擾(RNAi)技術敲低 PIK3R1 和 AKT1 的表達后證實,其對胃腺癌 SGC7901 細胞的侵襲具有抑制作用。PI3K 與致癌基因 ras 的結合對 ras 的轉化特性至關重要[16-17]。AKT 為人第 10 號染色體缺失的磷酸酶及張力蛋白同源的基因(PTEN)-PI3K 的下游效應因子,p-AKT 是 AKT 的活化形式,其在細胞的增殖、分化和存活中扮演著重要的角色[18]。PTEN 由于其脂質磷酸酶活性而負向調節 PI3K 信號通路,從而抑制下游成分(如 AKT 和NF-κB)的激活,刺激癌細胞增殖和生長[19-20],PTEN 的失活將導致 AKT 的異常活化。有研究[21-23]證實,核苷酸還原酶(RRM1)與 PI3K-Akt 通路的 PTEN 下調相關,進而引發代謝抑制。mTOR 位于 PI3K-AKT-mTOR 信號通路的下游,活化后通過介導下游重要信號分子而影響細胞增殖并抑制細胞凋亡,在多種惡性腫瘤中發現 mTOR 呈高表達。Wnt 信號通路是一組由蛋白質組成的信號轉導通路,通過細胞表面受體將信號傳遞到細胞中[24],最初用來描述脊椎動物和非脊椎動物的胚胎發育,隨后發現,非正常的 Wnt/β-catenin 通路的激活涉及到各種人類的多種不同類型的腫瘤發展[25-26]。Wnt 家族蛋白成員,如 Wnt1、Wnt2 和 Wnt2B 被發現在胃癌組織中呈表達上調狀態。關于該信號通路參與胃癌發生的機制可能是,通路過度表達破壞了正常胃黏膜的增殖、干細胞維持和穩態,導致胃腸上皮細胞的細胞增殖、細胞周期阻滯和細胞遷移之間出現失平衡,RAC1 作為中間環節也在其中發揮作用[27-28]。Notch 信號通路參與細胞增殖、分化、凋亡、干細胞維持等多個過程,在胃癌發生中 Notch 信號通路的激活不僅可以促進胃癌細胞增殖,抑制胃癌細胞凋亡,還能增加胃癌細胞的遷移性和侵襲性,在一定程度上加速了胃癌的進展[29]。
本研究檢測結果發現,主要上調通路有 3 條:NADK-CMPK1、OAS1-RSAD2 和 SAT1-AMD1。其中,SAT1-AMD1 通路中的 AMD1 基因主要通過催化S-腺苷甲硫氨酸脫羧產生脫羧 S-腺苷甲硫氨酸。與癌旁組織相比,AMD1 在胃癌組織中的表達明顯上調且 AMD1 高表達與腫瘤直徑和腫瘤浸潤深度密切相關(P<0.05),提示 AMD1 與胃癌的發生和發展密切相關[30]。而經證實,CMPK1 在非小細胞肺癌(NSCLC)進展中產生作用,可作為 NSCLC 治療的靶點之一[31]。OAS 是 IFN 或病毒誘導的蛋白質家族之一,它能調節巨噬細胞中宿主的先天免疫信號,從而在病毒感染過程的信號通路中發揮作用,比如抵抗黃病毒、西尼羅河病毒、登革熱病毒等[32]。RSAD2 在三陰性乳腺癌中表達上調,并且被用作預后預測因子[33]。
本研究檢測結果還發現,主要下調通路有 JAM2-JAM3,和以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 為主的關系網絡。其中,IGF1 介導的信號傳導控制著胃癌中的許多生物學過程。IGF1-IGF1R 途徑參與了胃癌中干擾素引導跨膜蛋白 2(IFITM2)表達的上調。轉錄的信號轉導活化蛋白質 3(STAT3)是由 IGF1-IGF1R 信號傳導激活的轉錄因子。磷酸化 STAT3 促進細胞存活和增殖、細胞周期進程、血管生成和轉移,在胃癌啟動和進展中承擔重要作用[34]。IGF1R 是受體酪氨酸激酶的胰島素受體家族的成員,它與底物途徑蛋白例如 mTOR 的上調與胃癌期間對化學療法的不良反應和不良預后密切相關,并且 IGF1R 信號傳導途徑的異常與胃癌期間耐藥性和化療反應差也有緊密關聯[35]。FGFR1 屬于受體酪氨酸激酶,參與多種生物學功能,如細胞增殖、存活、遷移和分化。FGFR1 在許多不同的細胞類型中表達,它的擴增與食管癌、乳腺癌和鱗狀細胞肺癌的生存率低有關[36]。與正常 GES-1 細胞相比,所有胃癌細胞系中 FGFR1 mRNA 及其蛋白的表達水平均顯著上調[37],并且它們的表達與不良的生存預后、轉移和 TNM 分期相關,表明 FGFR1 在胃癌的發生中起關鍵作用。SNAI2 位于 8 號染色體,又被稱作 slug 基因,經實驗證明,SNAI2 mRNA 的表達量在分化越低的胃癌組織中越高,不同分化胃癌組織的陽性表達率隨著分化程度降低而增加,癌組織的陽性表達率要高于正常胃黏膜[38]。在人類中,Rho GTP 酶(Rho GTPase)家族包含 20 個 Rho 小 G 蛋白,可分為 Cdc42 亞組、Rac 亞組、Rho 亞組和其他不太具備特征的亞組[39]。Rho GTP 酶所屬的 RAC1 功能十分復雜,參與腫瘤血管生成、細胞骨架組建和惡性細胞的多樣功能當中,它過度活化和過度表達似乎與侵襲性生長和其他惡性特征相關[40],還涉及到 PI3K-Akt、JNK/SAPK 信號通路活化的多種相關生物功能鏈[41-43]。CXCL 是一類能夠趨化細胞定向移動的分泌蛋白,它可以在結腸癌、肝癌、宮頸癌等惡性腫瘤中高表達,由癌相關成纖維細胞(CAFs)激活趨化因子 CXCL12/CXCL12 的特異受體(CXCR4)后,介導整合素 b1 聚集在細胞表面并促進胃癌細胞的侵襲[44],高表達 CXCL12 與 IGF1 的胃癌組織生長速度更高、轉移能力更強且腫瘤發展更快[45-46]。此外,CXCL12 還在癌細胞或微環境細胞上過度表達,通過 CXCR4 誘導巨噬細胞在瘤內微環境的遷移,也與腫瘤組織缺氧條件下的血管生成有關[47],說明 CXCL12 對這些腫瘤的增殖和轉移具有促進作用。SMAD4 是轉化生長因子 β(TGF-β)信號通路中的一個重要分子。有研究[48]證實,SMAD4 能夠提高胰腺癌細胞的遷移以及侵襲能力,表明它在胰腺腫瘤形成過程中能發揮作用。在胃癌方面,SMAD4 的高甲基化相對罕見,但 SMAD4 作為腫瘤抑制蛋白在細胞核中發揮的作用卻不容忽視[49-50],它是關鍵的預后因素。各種機制包括:核質穿梭的失調、雜合性缺失(LOH)的下調、高甲基化或蛋白酶體降解,都參與了胃癌中 SMAD4 的缺失。GLI3 是3 種 GLI 轉錄因子(GLI1、GLI2 和 GLI3)中的一種,在經典 Hedgehog(HH)信號通路中起重要作用。人 GLI3 由 15 個外顯子構建,編碼由 1 580 個氨基酸組成的蛋白質。GLI3 功能結構域包含 N 末端轉錄抑制因子、5 個鋅指(介導 DNA 結合)、蛋白酶切割位點、CBP 結合區、兩個 C 末端轉錄激活區和 α-螺旋區域[51],可以作為轉錄激活因子或抑制劑起作用[52]。GLI3 不僅在肝纖維化中發揮作用[53],而且在 NSCLC 癌組織中其蛋白表達水平高于癌旁組織,它對 NSCLC 病情的發展具有重要的促進作用[54]。多種致癌途徑增加 GLI 功能(非經典激活),包括 K-ras、PI3K/Akt 和 TGF-β,有助于腫瘤的發展和形成。MAPK10 是 MAPK 基因家族的成員,已經發現,MAPK 信號傳導途徑參與細胞發育、應激反應和其他細胞過程[55]。有研究[56]發現,MAPK10 可能受 miR-21 調控,從而調節乳腺癌的增殖和遷移并抑制乳腺癌細胞的凋亡。GNAI2 在免疫細胞中大量表達,參與 G 蛋白偶聯受體(GPCR)和非 GPCR 信號通路[57]。細胞環境可以使得 GNAI2 作為腫瘤抑制劑起作用,它也被證明是卵巢癌的診斷指標[58]。PI3K 信號傳導是幾種人類癌癥(包括結直腸癌)中最常被下調的途徑之一,也是最為有吸引力的治療靶點[59]。PIK3CA 和 AKT1 熱點突變是肛門生殖器區域的良性疾病—鞘膜炎(HP)中最常見的遺傳畸變,已鑒定 PIK3CA 和 PIK3R1 突變導致組成型激活的 PI3K/AKT 信號轉導[60]。磷酸肌醇-3-激酶調節亞基 1(PIK3R1)是 PI3K 信號傳導的組分,有研究發現,PIK3R1 軸能被下調的 circAKT3 靶向從而有效地增強 GC 細胞對小劑量順鉑(CDDP)的敏感性[61],另外 PIK3R1 在 CDDP 抗性卵巢癌細胞中高表達,它還是胰腺癌預后的臨床生物標志物[62]。VCL 被稱為肌動蛋白絲結合蛋白,參與細胞-基質黏附和細胞-細胞黏附,它調節細胞表面的 E 鈣黏蛋白表達,并通過 E 鈣黏蛋白復合物增強機械傳感[63]。VCL 也可能在細胞形態和運動中發揮重要作用。由 VCL 組成的復合物可用于將肌動蛋白絲錨定到膜上。VCL 在前列腺癌(PCa)細胞中高表達,在 PCa 細胞遷移中起關鍵作用[64]。這些基因表達蛋白被證實參與不同腫瘤的形成與發展,從獲得的實驗結果推測它們也參與胃癌發生的進程。
綜上,本研究運用基因芯片技術證實,提取的臨床胃癌樣本組織中存在著大量差異可變剪接轉錄本,它們的存在可能與原癌基因的激活、抑癌基因的突變、缺失以及細胞凋亡機制紊亂相關。利用基因富集分析,本研究篩選出來 NADK-CMPK1、OAS1-RSAD2、SAT1-AMD1 和 JAM2-JAM3 基因通路,以及以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 為主的基因通路網絡,這些經檢測有顯著差異性的基因,與胃腫瘤代謝密切關聯。基因在轉錄過程中可能涉及到 RNA 可變剪接,從而導致蛋白質異常表達。對于個別基因的具體研究還應結合它所可能聯系的相關生物學功能、信號通路等一并分析,以作出全面系統的概括。長鏈非編碼 RNA(LncRNA)作為 ncRNA 的重要組成部分,參與人體生理功能的調節;miRNA 作為復雜調控系統中必不可少的信號分子,與 LncRNA 相互作用并參與到可變剪接過程中。探索剪接體在腫瘤組織的變化模式并在癌前良性病變階段研發能對特定基因結構與功能進行檢測的生物標志物,從而為胃癌高危患者進行預警,繼而提供確鑿診斷依據,是今后胃癌相關診治的一個前景,也需要我們開展更深層次的研究來進一步證實。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:王一晨,數據統計分析和文章撰寫;王瑾,樣本收集和質檢;楊文山,協助分析;劉屏,技術指導和質控;董憲喆,研究方案設計和文章修校;胡園,文章修校。
倫理聲明:本研究已通過中國人民解放軍總醫院的倫理審核批準(批準文號:總 2015006)。