引用本文: 何進程, 王軍, 姜雷, 閔光濤, 姚南. 基于生物信息學分析 MET 基因過表達對胰腺癌患者預后的影響. 中國普外基礎與臨床雜志, 2021, 28(9): 1171-1176. doi: 10.7507/1007-9424.202012064 復制
胰腺癌是一種常見的惡性腫瘤,因其病程進展迅速及高侵襲性和高化學耐藥的特點,胰腺癌的發病率和病死率在全球范圍內均呈逐年遞增趨勢[1]。缺乏特異性腫瘤標志物作為早期篩查的手段和評價患者生存預后的指標,通常導致胰腺癌患者治療延誤[2]。因此,確立特異性生物標志物對于胰腺癌早期診斷和預后評價尤為重要。
胰腺癌的發生往往伴隨多個基因的改變[3-4],而某些特殊基因異常表達可能是影響胰腺癌患者預后的重要因素,也有望成為個體化治療的有效靶點[5]。近年來,隨著測序技術的快速發展,高通量基因組學可有效挖掘在腫瘤發生發展中的關鍵基因,并進一步分析其與腫瘤發生發展的有關機制。本研究通過在基因表達綜合(gene expression omnibus,GEO)數據庫和癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫下載胰腺癌基因芯片,篩選出與胰腺癌臨床預后密切相關的關鍵基因即間充質上皮轉化因子(mesenchymal epithelial transition factor,MET),并經基因表達譜交互分析(gene expression profiling interactive analysis,GEPIA)數據庫進一步驗證其在癌組織及其癌旁組織中的表達差異,探討 MET 基因與胰腺癌發生有關的可能分子機制,以期作為胰腺癌預后評價的臨床指標。
1 資料與方法
1.1 GEO 數據分析
在 GEO 數據庫(
1.2 TCGA 數據分析
從 TCGA 數據庫(
1.3 GO 和 KEGG 富集分析
使用 R 軟件中的“clusterProfiler”“richplot”和“ggplot2”函數,對 DEGs 進行了基因本體論(gene ontology,GO)和京都基因和基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)在線富集分析,其中僅有 P<0.05 且 FDR<0.05 的富集術語具有統計學差異。
1.4 GEPIA 數據庫分析
通過 GEPIA 在線數據庫(
1.5 統計學方法
采用 R(v.4.0.2)軟件及 SPSS 26.0 軟件對數據進行統計學分析。通過 Kolmogorov-Smirnov 檢驗 TCGA 數據庫胰腺癌組織 MET 基因表達數據正態分布情況,結果顯示符合正態分布,并使用 GraphPad Prism 7.0 軟件繪制受試者工作特征(ROC)曲線。使用 R 軟件 limma 包篩選 GSE28735 和 GSE62452 基因芯片數據集中胰腺癌組織與癌旁組織的 DEGs;采用 Wilcoxon 秩和檢驗分析胰腺癌臨床病理特征與各基因表達量的關系,篩選臨床相關性基因;采用 Pearson χ2 檢驗和連續校正法分析 MET 基因表達與胰腺癌患者臨床病理特征的相關性;Kaplan-Meier 方法評估胰腺癌患者的總體生存情況;單因素 COX 回歸分析 MET 基因表達及胰腺癌臨床病理特征對患者預后的影響,并將 P<0.1 的變量納入多因素 COX 回歸分析。檢驗水準 α=0.05(雙尾)。
2 結果
2.1 篩選胰腺癌關鍵基因
2.1.1 篩選胰腺癌癌組織及其癌旁組織中的 DEGs
以 |log2FC|>1 且 FDR<0.05(FC=腫瘤組織/癌旁組織)為篩選標準對 GSE28735 和 GSE62452 基因芯片進行基因差異表達分析,其結果顯示:在 GSE28735 基因芯片中,有 240 個基因在胰腺癌組織中表達上調,171 個基因表達下調(圖 1a);在 GSE62452 基因芯片中,有 180 個基因在胰腺癌組織中表達上調,114 個基因表達下調(圖 1b)。

a:GSE28735 火山圖;b:GSE62452 火山圖;c:GSE28735 和 GSE62452 基因芯片的 DEGs 和 TCGA 臨床相關基因整合后的韋恩圖;d、e:示 GSE28735(d)和 GSE62452(e)基因芯片中 MET 基因在癌組織及其癌旁組織中的表達結果;f:GEPIA 數據庫中胰腺癌組織及其癌旁組織中 MET 基因的表達;g、h:示 GSE28735(g)和 GSE62452(h)基因芯片中 MET 基因模擬診斷胰腺癌的 ROC 曲線;i:MET 基因模擬判斷胰腺癌 5 年生存期的 ROC 曲線。火山圖中 log2 FC 表示胰腺癌組織與癌旁組織中基因表達倍數的對數;–log(FDR)表示 FDR 法校正后的
2.1.2 篩選臨床相關顯著基因
對 TCGA 數據庫中胰腺癌組織的基因芯片和胰腺癌臨床病理特征(包括患者年齡、性別、腫瘤的組織學分級[6]、TNM 分期、T 分期以及 N 分期)進行相關性分析以篩選臨床相關顯著基因,結果共篩選到 103 個臨床相關顯著基因(P<0.05)。
2.1.3 篩選關鍵基因
使用 R 軟件的“Venn Diagram”函數將差異表達顯著基因與臨床相關顯著基因進行整合并可視化,其結果顯示,在 GSE28735 和 GSE62452 基因芯片的差異表達基因中,有 281 個相同基因,提示這些基因可能與胰腺癌的發生發展具有密切關系;而差異表達顯著基因且臨床相關性較強的基因有 3 個(韋恩圖,圖 1c),分別為 MET、DEXD/H 盒解旋酶 60(DEXD/H box helicase 60,DDX60)和犬尿氨酸酶(kynureninase,KYNU)。本研究選擇 MET 基因作為關鍵基因,進一步研究其表達對胰腺癌患者預后的影響。
2.2 MET 基因在胰腺癌組織及其癌旁組織中的表達情況
生物信息學分析結果顯示:GSE28735 和 GSE62452 基因芯片中,MET 基因在胰腺癌組織中的表達量明顯高于癌旁組織,其差異具有統計學意義(log2FC=1.28,P=2.0×10?9,FDR=1.64×10?9;log2FC=1.43,P=2.7×10?11,FDR=1.64×10?9),見圖 1d、1e。在 GEPIA 在線數據庫中,對 GEPIA 數據庫中 179 例胰腺癌組織和 171 例癌旁組織樣本的分析同樣證實 MET 基因在胰腺癌組織中的表達量高于癌旁組織(P<0.001),見圖 1f。為評估 MET 診斷胰腺癌的價值,本研究分別繪制了 GSE28735 和 GSE62452 基因芯片的 ROC 曲線,其結果顯示, MET 基因模擬診斷胰腺癌的 ROC 曲線下面積(AUC)分別為 0.87 和 0.84,敏感度分別為 88.9% 和 73.9%,特異度分別為 82.2% 和 86.9%(圖 1g、1h)。其結果提示 MET 可能是胰腺癌臨床診斷有價值的生物標志物。
為了評估 MET 預測胰腺癌患者預后的價值,本研究以 5 年期的生存狀態為結局變量,進一步繪制 ROC 曲線以分析 TCGA 數據庫的 MET 基因表達數據,其結果顯示,MET 基因模擬判斷胰腺癌患者預后的 ROC 曲線下面積(AUC)為 0.72,最佳臨界值(Cut-off)為 16.6,敏感度為 73.9%,特異度為 60.3%。見圖 1i。
2.3 胰腺癌組織中 MET 基因表達與其臨床病理特征的相關性分析結果
本研究將 TCGA 數據庫 177 例胰腺癌組織樣本篩選后得到 168 例臨床信息完整的基因表達數據。通過與 MET 基因表達中位值比較將腫瘤樣本分為高、低表達組,進一步 分析其 MET 基因的表達水平與胰腺癌臨床病理特征的關系,結果顯示 MET 基因的表達水平與患者年齡、T 分期和腫瘤的組織學分級(Grade)有關(P<0.05),與患者性別、TNM 分期和 N 分期無明顯相關性(P>0.05),見表 1。

2.4 MET 基因表達對胰腺癌患者預后的影響
本研究將 TCGA 數據庫預處理的 177 例胰腺癌樣本整理后得到 176 例生存信息完整的 MET 基因表達數據,通過中位值將 MET 基因表達樣本分為高表達組和低表達組并繪制 Kaplan-Meier 生存曲線(圖 2a),其結果顯示,MET 基因高表達組患者的總生存率和生存時間低于(短于)低表達組患者,差異有統計學意義(P=4.6×10?5)。本研究進一步對 GEPIA 數據庫中 178 例胰腺癌樣本的 MET 基因表達與預后的關系進行分析,其結果也顯示 MET 基因高表達組的總生存率和無病生存率均低于低表達組(圖 2b、2c)。本研究使用 COX 回歸模型進一步評估了 MET 的預后價值,單因素和多因素 COX 分析結果均顯示:MET 基因高表達、患者年齡>65 歲和腫瘤 N1 分期是胰腺癌患者預后的獨立危險因素(P<0.05),見表 2。


a:TCGA 數據庫中 176 例胰腺癌患者的生存曲線;b、c:GEPIA 數據庫中 178 例胰腺癌患者的總生存曲線(b)和無病生存曲線(c)
2.5 GO 富集分析結果
應用生物信息學對 TCGA 數據庫的胰腺癌樣本的基因表達進行分析,共獲得 1 019 個 DEGs, 對其進行 GO 富集分析。其結果顯示:MET 基因參與了:① 生物過程(biological process,BP),包括皮膚發育、組織遷移、Ras 蛋白信號傳導、細胞趨化、酪氨酸肽基修飾、蛋白激酶 B 的信號、Rho 信號傳導、G 蛋白偶聯受體信號傳導等;② 細胞成分(cellular component,CC),MET 可能參與構成了細胞質膜基底部;③ 分子功能(molecular function,MF),MET 可能參與調節跨膜受體蛋白酪氨酸激酶活性。具體見表 3。

2.6 KEGG 富集分析結果
應用生物信息學對胰腺癌 1 019 個差異表達基因進行 KEGG 通路分析,結果顯示:MET 基因主要參與磷脂酰肌醇激酶/絲氨酸蘇氨酸激酶(PI3K/AKT)信號通路、粘著斑(FAK) 信號通路、腫瘤蛋白聚糖、癌癥轉錄失調節、軸突導向、肝細胞肝癌、黏著連接等。詳見表 4。

3 討論
胰腺癌是惡性程度最高的消化道腫瘤之一。因其起病隱匿、癥狀缺乏特異性,難以早期診斷,以致于多數患者就診時已錯過最佳治療期[7]。因此,基于生物信息學篩選有效的腫瘤標志物對于胰腺癌臨床早期篩查、早期診斷、及時治療以及患者預后評價都具有重要意義。
原癌基因 MET 的蛋白產物 c-Met 是一種二硫鍵連接的 α-β 異二聚體受體酪氨酸激酶,主要在上皮細胞表達,其自然配體是由間充質細胞旁分泌的肝細胞生長因子(hepatocyte growth factor,HGF) [8]。正常生理情況下,c-Met 與外源性配體 HGF 結合發生自磷酸化具有多種生物調節功能,包括細胞有絲分裂、細胞遷移、組織再生、傷口愈合等,然而基因擴增或突變導致的 HGF/c-Met 信號軸病理性異常可激活多種下游信號通路促進腫瘤細胞增殖、侵襲轉移和血管生成[9],如 PI3K/AKT 信號通路、兩面神激酶/信號轉導與轉錄激活子信號通路(JAK/STAT)、絲裂原激活的蛋白激酶途徑(Ras/MAPK)以及 Wnt/β-連環素信號傳導通路(Wnt /β-catenin)。Park 等[10]發現,約占 50% 的非小細胞肺癌患者都表現出 c-Met 過表達,并可預測其不良預后。MET 基因擴增導致的過表達還在胃食管癌、乳腺癌和神經膠質瘤都表現出與腫瘤患者不良預后相關[11]。此外,過表達的 HGF 還通過激活 MET 誘導粘著斑激酶(p125FAK)在 pY397(自磷酸化位點,結合 Src 家族 SH2 和 PI3-K 的 p85 亞基)和 pY861(Src 的主要磷酸化位點)的酪氨酸磷酸化,進而促進腫瘤細胞增殖、抗凋亡和侵襲遷移[12-13]。
本研究基于高通量基因組學篩選出胰腺癌的關鍵基因 MET。其分析結果顯示,MET 基因在胰腺癌組織高表達并預示胰腺癌患者的不良預后。胰腺癌診斷模型 ROC 曲線顯示,MET 在胰腺癌的診斷中具有較高的臨床價值;而胰腺癌患者預后模型的 ROC 曲線敏感度和特異度均不高,可能歸因于腫瘤樣本量仍較少。通過對臨床資料分析表明,MET 表達水平與患者年齡、腫瘤的組織學分級和 T 分期相關,提示 MET 可能促進腫瘤侵襲、加速腫瘤進展。進一步 COX 回歸模型分析結果表明,MET 基因表達上調是胰腺癌患者預后不良的獨立危險因素。MET 基因可能是胰腺癌有價值的腫瘤標志物。
為了進一步探究 MET 基因參與胰腺癌發生、發展的機制,本研究對胰腺癌 DEGs 進行 GO 富集分析,其結果顯示,MET 基因參與了酪氨酸肽基修飾、蛋白激酶 B 信號、Ras 蛋白信號傳導、Rho 信號傳導、G 蛋白偶聯受體信號傳導等生物過程;KEGG 富集分析結果顯示:MET 基因主要參與 PI3K-Akt 信號通路、FAK 信號通路、腫瘤蛋白聚糖、癌癥轉錄失調節等信號通路。相關研究[14-15]表明,PI3K-Akt 信號通路和 FAK 信號通路是胰腺癌發生的關鍵途徑。Asano 等[16]證實,胰腺癌 PI3K-Akt 信號通路的激活涉及受體酪氨酸激酶。大量的研究[9, 17-20]已證實,c-Met 激活的經典模式涉及 HGF 與 c-Met 的結合,進而誘導 c-Met 的胞質域進行自身磷酸化以觸發下游信號通路,如 MAPK/ERK 途徑、p38、PI3K/AKT 途徑等。此外,c-Met 還可以其他非經典途徑激活[21],如與 FAK 的串擾調節、基因突變等。HGF/c-Met 軸已被證實為肝細胞肝癌患者重要的預后生物標志物,并在腫瘤耐藥性的發生中具有重要作用[22]。針對 c-Met 的靶向療法有望成為胰腺癌有效的治療方案,相關的臨床試驗已被應用與肝癌患者[23-24]。
我們基于生物信息學研究發現,MET 基因在胰腺癌的發生和進展中扮演了重要角色,其高表達預示了胰腺癌患者的不良預后,有望成為胰腺癌有價值的生物標志物和治療靶點。有待進一步研究可能的分子機制為后續實驗提供理論依據。
重要聲明
利益沖突聲明:作者宣稱,本研究是在沒有任何商業或金融關系的情況下進行的,沒有潛在的利益沖突。
作者貢獻聲明:姚南和何進程提供了研究思路和方向;何進程和閔光濤實施研究并撰寫初稿;王軍和姜雷提供了論文修改意見。
胰腺癌是一種常見的惡性腫瘤,因其病程進展迅速及高侵襲性和高化學耐藥的特點,胰腺癌的發病率和病死率在全球范圍內均呈逐年遞增趨勢[1]。缺乏特異性腫瘤標志物作為早期篩查的手段和評價患者生存預后的指標,通常導致胰腺癌患者治療延誤[2]。因此,確立特異性生物標志物對于胰腺癌早期診斷和預后評價尤為重要。
胰腺癌的發生往往伴隨多個基因的改變[3-4],而某些特殊基因異常表達可能是影響胰腺癌患者預后的重要因素,也有望成為個體化治療的有效靶點[5]。近年來,隨著測序技術的快速發展,高通量基因組學可有效挖掘在腫瘤發生發展中的關鍵基因,并進一步分析其與腫瘤發生發展的有關機制。本研究通過在基因表達綜合(gene expression omnibus,GEO)數據庫和癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫下載胰腺癌基因芯片,篩選出與胰腺癌臨床預后密切相關的關鍵基因即間充質上皮轉化因子(mesenchymal epithelial transition factor,MET),并經基因表達譜交互分析(gene expression profiling interactive analysis,GEPIA)數據庫進一步驗證其在癌組織及其癌旁組織中的表達差異,探討 MET 基因與胰腺癌發生有關的可能分子機制,以期作為胰腺癌預后評價的臨床指標。
1 資料與方法
1.1 GEO 數據分析
在 GEO 數據庫(
1.2 TCGA 數據分析
從 TCGA 數據庫(
1.3 GO 和 KEGG 富集分析
使用 R 軟件中的“clusterProfiler”“richplot”和“ggplot2”函數,對 DEGs 進行了基因本體論(gene ontology,GO)和京都基因和基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)在線富集分析,其中僅有 P<0.05 且 FDR<0.05 的富集術語具有統計學差異。
1.4 GEPIA 數據庫分析
通過 GEPIA 在線數據庫(
1.5 統計學方法
采用 R(v.4.0.2)軟件及 SPSS 26.0 軟件對數據進行統計學分析。通過 Kolmogorov-Smirnov 檢驗 TCGA 數據庫胰腺癌組織 MET 基因表達數據正態分布情況,結果顯示符合正態分布,并使用 GraphPad Prism 7.0 軟件繪制受試者工作特征(ROC)曲線。使用 R 軟件 limma 包篩選 GSE28735 和 GSE62452 基因芯片數據集中胰腺癌組織與癌旁組織的 DEGs;采用 Wilcoxon 秩和檢驗分析胰腺癌臨床病理特征與各基因表達量的關系,篩選臨床相關性基因;采用 Pearson χ2 檢驗和連續校正法分析 MET 基因表達與胰腺癌患者臨床病理特征的相關性;Kaplan-Meier 方法評估胰腺癌患者的總體生存情況;單因素 COX 回歸分析 MET 基因表達及胰腺癌臨床病理特征對患者預后的影響,并將 P<0.1 的變量納入多因素 COX 回歸分析。檢驗水準 α=0.05(雙尾)。
2 結果
2.1 篩選胰腺癌關鍵基因
2.1.1 篩選胰腺癌癌組織及其癌旁組織中的 DEGs
以 |log2FC|>1 且 FDR<0.05(FC=腫瘤組織/癌旁組織)為篩選標準對 GSE28735 和 GSE62452 基因芯片進行基因差異表達分析,其結果顯示:在 GSE28735 基因芯片中,有 240 個基因在胰腺癌組織中表達上調,171 個基因表達下調(圖 1a);在 GSE62452 基因芯片中,有 180 個基因在胰腺癌組織中表達上調,114 個基因表達下調(圖 1b)。

a:GSE28735 火山圖;b:GSE62452 火山圖;c:GSE28735 和 GSE62452 基因芯片的 DEGs 和 TCGA 臨床相關基因整合后的韋恩圖;d、e:示 GSE28735(d)和 GSE62452(e)基因芯片中 MET 基因在癌組織及其癌旁組織中的表達結果;f:GEPIA 數據庫中胰腺癌組織及其癌旁組織中 MET 基因的表達;g、h:示 GSE28735(g)和 GSE62452(h)基因芯片中 MET 基因模擬診斷胰腺癌的 ROC 曲線;i:MET 基因模擬判斷胰腺癌 5 年生存期的 ROC 曲線。火山圖中 log2 FC 表示胰腺癌組織與癌旁組織中基因表達倍數的對數;–log(FDR)表示 FDR 法校正后的
2.1.2 篩選臨床相關顯著基因
對 TCGA 數據庫中胰腺癌組織的基因芯片和胰腺癌臨床病理特征(包括患者年齡、性別、腫瘤的組織學分級[6]、TNM 分期、T 分期以及 N 分期)進行相關性分析以篩選臨床相關顯著基因,結果共篩選到 103 個臨床相關顯著基因(P<0.05)。
2.1.3 篩選關鍵基因
使用 R 軟件的“Venn Diagram”函數將差異表達顯著基因與臨床相關顯著基因進行整合并可視化,其結果顯示,在 GSE28735 和 GSE62452 基因芯片的差異表達基因中,有 281 個相同基因,提示這些基因可能與胰腺癌的發生發展具有密切關系;而差異表達顯著基因且臨床相關性較強的基因有 3 個(韋恩圖,圖 1c),分別為 MET、DEXD/H 盒解旋酶 60(DEXD/H box helicase 60,DDX60)和犬尿氨酸酶(kynureninase,KYNU)。本研究選擇 MET 基因作為關鍵基因,進一步研究其表達對胰腺癌患者預后的影響。
2.2 MET 基因在胰腺癌組織及其癌旁組織中的表達情況
生物信息學分析結果顯示:GSE28735 和 GSE62452 基因芯片中,MET 基因在胰腺癌組織中的表達量明顯高于癌旁組織,其差異具有統計學意義(log2FC=1.28,P=2.0×10?9,FDR=1.64×10?9;log2FC=1.43,P=2.7×10?11,FDR=1.64×10?9),見圖 1d、1e。在 GEPIA 在線數據庫中,對 GEPIA 數據庫中 179 例胰腺癌組織和 171 例癌旁組織樣本的分析同樣證實 MET 基因在胰腺癌組織中的表達量高于癌旁組織(P<0.001),見圖 1f。為評估 MET 診斷胰腺癌的價值,本研究分別繪制了 GSE28735 和 GSE62452 基因芯片的 ROC 曲線,其結果顯示, MET 基因模擬診斷胰腺癌的 ROC 曲線下面積(AUC)分別為 0.87 和 0.84,敏感度分別為 88.9% 和 73.9%,特異度分別為 82.2% 和 86.9%(圖 1g、1h)。其結果提示 MET 可能是胰腺癌臨床診斷有價值的生物標志物。
為了評估 MET 預測胰腺癌患者預后的價值,本研究以 5 年期的生存狀態為結局變量,進一步繪制 ROC 曲線以分析 TCGA 數據庫的 MET 基因表達數據,其結果顯示,MET 基因模擬判斷胰腺癌患者預后的 ROC 曲線下面積(AUC)為 0.72,最佳臨界值(Cut-off)為 16.6,敏感度為 73.9%,特異度為 60.3%。見圖 1i。
2.3 胰腺癌組織中 MET 基因表達與其臨床病理特征的相關性分析結果
本研究將 TCGA 數據庫 177 例胰腺癌組織樣本篩選后得到 168 例臨床信息完整的基因表達數據。通過與 MET 基因表達中位值比較將腫瘤樣本分為高、低表達組,進一步 分析其 MET 基因的表達水平與胰腺癌臨床病理特征的關系,結果顯示 MET 基因的表達水平與患者年齡、T 分期和腫瘤的組織學分級(Grade)有關(P<0.05),與患者性別、TNM 分期和 N 分期無明顯相關性(P>0.05),見表 1。

2.4 MET 基因表達對胰腺癌患者預后的影響
本研究將 TCGA 數據庫預處理的 177 例胰腺癌樣本整理后得到 176 例生存信息完整的 MET 基因表達數據,通過中位值將 MET 基因表達樣本分為高表達組和低表達組并繪制 Kaplan-Meier 生存曲線(圖 2a),其結果顯示,MET 基因高表達組患者的總生存率和生存時間低于(短于)低表達組患者,差異有統計學意義(P=4.6×10?5)。本研究進一步對 GEPIA 數據庫中 178 例胰腺癌樣本的 MET 基因表達與預后的關系進行分析,其結果也顯示 MET 基因高表達組的總生存率和無病生存率均低于低表達組(圖 2b、2c)。本研究使用 COX 回歸模型進一步評估了 MET 的預后價值,單因素和多因素 COX 分析結果均顯示:MET 基因高表達、患者年齡>65 歲和腫瘤 N1 分期是胰腺癌患者預后的獨立危險因素(P<0.05),見表 2。


a:TCGA 數據庫中 176 例胰腺癌患者的生存曲線;b、c:GEPIA 數據庫中 178 例胰腺癌患者的總生存曲線(b)和無病生存曲線(c)
2.5 GO 富集分析結果
應用生物信息學對 TCGA 數據庫的胰腺癌樣本的基因表達進行分析,共獲得 1 019 個 DEGs, 對其進行 GO 富集分析。其結果顯示:MET 基因參與了:① 生物過程(biological process,BP),包括皮膚發育、組織遷移、Ras 蛋白信號傳導、細胞趨化、酪氨酸肽基修飾、蛋白激酶 B 的信號、Rho 信號傳導、G 蛋白偶聯受體信號傳導等;② 細胞成分(cellular component,CC),MET 可能參與構成了細胞質膜基底部;③ 分子功能(molecular function,MF),MET 可能參與調節跨膜受體蛋白酪氨酸激酶活性。具體見表 3。

2.6 KEGG 富集分析結果
應用生物信息學對胰腺癌 1 019 個差異表達基因進行 KEGG 通路分析,結果顯示:MET 基因主要參與磷脂酰肌醇激酶/絲氨酸蘇氨酸激酶(PI3K/AKT)信號通路、粘著斑(FAK) 信號通路、腫瘤蛋白聚糖、癌癥轉錄失調節、軸突導向、肝細胞肝癌、黏著連接等。詳見表 4。

3 討論
胰腺癌是惡性程度最高的消化道腫瘤之一。因其起病隱匿、癥狀缺乏特異性,難以早期診斷,以致于多數患者就診時已錯過最佳治療期[7]。因此,基于生物信息學篩選有效的腫瘤標志物對于胰腺癌臨床早期篩查、早期診斷、及時治療以及患者預后評價都具有重要意義。
原癌基因 MET 的蛋白產物 c-Met 是一種二硫鍵連接的 α-β 異二聚體受體酪氨酸激酶,主要在上皮細胞表達,其自然配體是由間充質細胞旁分泌的肝細胞生長因子(hepatocyte growth factor,HGF) [8]。正常生理情況下,c-Met 與外源性配體 HGF 結合發生自磷酸化具有多種生物調節功能,包括細胞有絲分裂、細胞遷移、組織再生、傷口愈合等,然而基因擴增或突變導致的 HGF/c-Met 信號軸病理性異常可激活多種下游信號通路促進腫瘤細胞增殖、侵襲轉移和血管生成[9],如 PI3K/AKT 信號通路、兩面神激酶/信號轉導與轉錄激活子信號通路(JAK/STAT)、絲裂原激活的蛋白激酶途徑(Ras/MAPK)以及 Wnt/β-連環素信號傳導通路(Wnt /β-catenin)。Park 等[10]發現,約占 50% 的非小細胞肺癌患者都表現出 c-Met 過表達,并可預測其不良預后。MET 基因擴增導致的過表達還在胃食管癌、乳腺癌和神經膠質瘤都表現出與腫瘤患者不良預后相關[11]。此外,過表達的 HGF 還通過激活 MET 誘導粘著斑激酶(p125FAK)在 pY397(自磷酸化位點,結合 Src 家族 SH2 和 PI3-K 的 p85 亞基)和 pY861(Src 的主要磷酸化位點)的酪氨酸磷酸化,進而促進腫瘤細胞增殖、抗凋亡和侵襲遷移[12-13]。
本研究基于高通量基因組學篩選出胰腺癌的關鍵基因 MET。其分析結果顯示,MET 基因在胰腺癌組織高表達并預示胰腺癌患者的不良預后。胰腺癌診斷模型 ROC 曲線顯示,MET 在胰腺癌的診斷中具有較高的臨床價值;而胰腺癌患者預后模型的 ROC 曲線敏感度和特異度均不高,可能歸因于腫瘤樣本量仍較少。通過對臨床資料分析表明,MET 表達水平與患者年齡、腫瘤的組織學分級和 T 分期相關,提示 MET 可能促進腫瘤侵襲、加速腫瘤進展。進一步 COX 回歸模型分析結果表明,MET 基因表達上調是胰腺癌患者預后不良的獨立危險因素。MET 基因可能是胰腺癌有價值的腫瘤標志物。
為了進一步探究 MET 基因參與胰腺癌發生、發展的機制,本研究對胰腺癌 DEGs 進行 GO 富集分析,其結果顯示,MET 基因參與了酪氨酸肽基修飾、蛋白激酶 B 信號、Ras 蛋白信號傳導、Rho 信號傳導、G 蛋白偶聯受體信號傳導等生物過程;KEGG 富集分析結果顯示:MET 基因主要參與 PI3K-Akt 信號通路、FAK 信號通路、腫瘤蛋白聚糖、癌癥轉錄失調節等信號通路。相關研究[14-15]表明,PI3K-Akt 信號通路和 FAK 信號通路是胰腺癌發生的關鍵途徑。Asano 等[16]證實,胰腺癌 PI3K-Akt 信號通路的激活涉及受體酪氨酸激酶。大量的研究[9, 17-20]已證實,c-Met 激活的經典模式涉及 HGF 與 c-Met 的結合,進而誘導 c-Met 的胞質域進行自身磷酸化以觸發下游信號通路,如 MAPK/ERK 途徑、p38、PI3K/AKT 途徑等。此外,c-Met 還可以其他非經典途徑激活[21],如與 FAK 的串擾調節、基因突變等。HGF/c-Met 軸已被證實為肝細胞肝癌患者重要的預后生物標志物,并在腫瘤耐藥性的發生中具有重要作用[22]。針對 c-Met 的靶向療法有望成為胰腺癌有效的治療方案,相關的臨床試驗已被應用與肝癌患者[23-24]。
我們基于生物信息學研究發現,MET 基因在胰腺癌的發生和進展中扮演了重要角色,其高表達預示了胰腺癌患者的不良預后,有望成為胰腺癌有價值的生物標志物和治療靶點。有待進一步研究可能的分子機制為后續實驗提供理論依據。
重要聲明
利益沖突聲明:作者宣稱,本研究是在沒有任何商業或金融關系的情況下進行的,沒有潛在的利益沖突。
作者貢獻聲明:姚南和何進程提供了研究思路和方向;何進程和閔光濤實施研究并撰寫初稿;王軍和姜雷提供了論文修改意見。