引用本文: 王何斌, 劉德欽, 楊茂輝, 應偉, 周國俊, 馮彥超, 鐘曉蓉, 李文菠, 冷政偉. 應用生物信息學分析篩選肝細胞癌關鍵基因及表達驗證. 中國普外基礎與臨床雜志, 2021, 28(6): 743-750. doi: 10.7507/1007-9424.202010071 復制
肝細胞癌(hepatocellular carcinoma,HCC)是消化系統最常見的惡性腫瘤之一,據美國癌癥協會統計,HCC 在男性腫瘤中的發病率排第 6 位,但在女性中仍以每年超過 2% 的速度增長,其病死率在男性排第 5 位,在女性排第 6 位[1]。與其他腫瘤相似,HCC 的發生與其潛在的危險因素包括肥胖、酗酒、乙型肝炎病毒(HBV)及丙型肝炎病毒(HCV)感染、非酒精性脂肪性肝病、某些基因突變等[2-3]。雖然近年來 HCC 的治療取得了很大進展,但其預后仍不理想,其主要原因是早期診斷困難、復發和轉移[4]。越來越多的證據表明,基因異常表達與 HCC 的啟動和預后不良有關[5-6]。因此,準確找到導致 HCC 的相關基因,從基因水平上研究 HCC 已成為研究熱點之一。
近年來,利用生物信息學和基因芯片技術研究因基因失活或突變所致腫瘤的發生發展已成為發展趨勢[7]。基因芯片具有數據全面、樣本量大等優點,在生物學及醫學領域占據重要位置。但這些數據信息混雜、缺乏足夠實驗基礎,因此如何挖掘出準確可靠的基因信息成為了生物信息學研究熱點。本研究通過生物信息學方法對 HCC 及其癌旁組織的基因芯片中的差異基因進行分析并進行臨床樣本表達驗證,旨在篩選出與 HCC 發生發展的關鍵基因,為 HCC 的早期診斷、靶向治療等提供參考。
1 資料與方法
1.1 芯片數據信息來源
HCC 芯片從 NCBI-GEO(
1.2 差異表達基因(differentially expressed genes,DEGs)篩選
通過 GEO2R 在線工具(
1.3 GO 功能分析和 KEGG 通路富集分析
利用生物學信息注釋數據庫(database for annotation,visualization and integrated discovery,DAVID)對 DEGs 進行系統綜合的生物學功能注釋分析。將 DEGs 上傳到 DAVID 數據庫(
1.4 蛋白相互作用網絡(PPI)分析和核心 DEGs 篩選
將所獲得的 DEGs 用 STRING(https://string-db.org)進行 PPI 網絡圖的構建,構建后的網絡圖利用 Cytoscape3.7.2 軟件及 MCODE 插件分析,篩選出核心 DEGs。MCODE 分析設置條件:度數截斷值=2,節點分數截斷值=0.2,K-分數=2,最大深度=100。
1.5 核心 DEGs 生存分析
通過 Kaplan-Meier Plotter 數據庫(
1.6 與預后相關的 DEGs 在癌組織及其癌旁組織中的表達情況分析
將通過 Kaplan-Meier Plotter 數據庫篩選出的與預后相關的 DEGs 通過 GEPIA 數據庫(
1.7 與預后相關且在 HCC 中高表達 DEGs 的功能及通路富集分析
將獲得的與預后相關且在 HCC 中高表達的 DEGs 上傳至基因富集分析網站 Mmetascape(
1.8 免疫組織化學染色
選取川北醫學院附屬醫院肝膽外二科近 5 年手術切除的 HCC 組織和癌旁組織標本各 70 例用于免疫組化染色(IHC)觀察 RRM2 在組織中的表達情況:所取組織標本石蠟包埋,5 μm 切片,使用標準的免疫過氧化物酶染色程序進行 IHC 分析。抗 RRM2 一抗(購買自 Signaway Antibody 有限公司)的使用濃度為 1∶50。根據切片的染色強度計分:1 個視野中著色細胞少于 25% 判為陰性、0 分;著色細胞 25%~50% 判為弱陽性、1 分,著色細胞 50%~75% 判為陽性、2 分,著色細胞>75% 判為強陽性、3 分;再根據陽性細胞所占百分比計分:陽性細胞所占百分比<5% 計 0 分;5%~25% 計 1 分;25%~50% 計 2 分;50%~75% 計 3 分;>75% 計 4 分。最終以染色強度計分與陽性細胞所占百分比計分的乘積作為免疫組化染色結果,為 0~12 分,以 6 分為界限分為低表達樣本和高表達樣本。然后使用 SPSS 分別對 HCC 組織和癌旁組織的染色評分進行數據統計,再把統計數據導入 GraphPad prism8 軟件中繪制統計圖。
1.9 統計學方法
對 RRM2 在 HCC 組織及其癌旁組織中進行驗證,其結果采用 SPPS 統計軟件對數據進行分析。計量數據符合正態分布,數據用均數±標準差(±s)表示,采用 t 檢驗。檢驗水準 α=0.05。
2 結果
2.1 DEGs 篩選結果
在 3 個基因芯片 GSE14520、GSE60502 和 GSE102079 分別篩選出 DEGs 277 個、321 個和 204 個,其中上調的 DEGs 分別為 57 個、123 個和 56 個,下調的 DEGs 分別為 220 個、198 個和 148 個,3 個基因芯片的共差異上調基因有 16 個,共差異下調基因有 78 個,94 個共表達的 DEGs 詳見表 1。

2.2 94 個共表達的 DEGs 的 GO 功能分析和 KEGG 通路富集分析結果
2.2.1 GO 功能分析結果
94 個共表達的 DEGs 的 GO 功能分析結果見表 2。由表 2 可見,其 BP 共涉及 43 個方面,主要集中在 P450 表氧化酶通路、外源性藥物代謝過程、異型生物質的代謝過程、細胞負增長的調控、類固醇代謝過程、細胞對鎘離子反應、氧化還原過程、細胞對鋅離子的反應等;MF 共有 17 個相關方面,其中主要集中于氧化還原酶活性、血紅素結合、鐵離子結合、花生四烯酸環氧合酶活性、單加氧酶活性、甾體羥化酶活性、咖啡因氧化酶活性、芳香酶活性等;CC 共涉及 15 個方面,其中有統計學意義的有細胞器膜、血液微粒、細胞外區、細胞外泌體、細胞外間隙、內質網膜、IgM 免疫球蛋白復合物、六聚體 IgG 免疫球蛋白復合物和胰島素樣生長因子結合蛋白復合物。

2.2.2 KEGG 通路富集分析結果
94 個共表達的 DEGs 的 KEGG 通路富集分析結果見表 3。由表 3 可見,共涉及 11 個通路,包括視黃醇代謝、藥物代謝-細胞色素 P450、化學致癌性、細胞色素 P450 對外源性藥物的代謝、亞油酸代謝、代謝途徑、礦物質吸收、咖啡因代謝、甾體類激素生物合成、花生四烯酸代謝、糖酵解-糖異生 P53 信號通路。

2.3 PPI 網絡分析及核心 DEGs 篩選結果
將 94 個 DEGs 通過 STRING 分析構建 PPI 網絡圖,有 8 個基因未出現在 PPI 網絡中,剩余的 86 個基因包括上調基因 16 個和下調基因 70 個,再用 Cytoscape 3.7.2 軟件分析后,因為有 9 個基因與其他基因無任何聯系,所以未出現在 PPI 網絡中,得到 77 個 DEGs,共有蛋白之間相互作用關系線條 193 條,經 MCODE 插件分析后得到 2 簇相交點最多的基因簇,分別有上調基因 9 個和下調基因 10 個、有 36 條及 40 條線,其分值分別為 9.000 和 8.889,將其定義為核心 DEGs。19 個核心 DEGs 見圖 1a。

a:示 77 個共表達 DEGs 的 PPI 圖及核心 DEGs 篩選結果,紅色方框內為上調核心 DEGs;紫色方框內為下調核心 DEGs;1b–1j:示 9 個有統計學意義的核心 DEGs 生存分析結果;1k–1s:示 9 個 DEGs 在 HCC 組織及其癌旁組織中表達情況;1t–1v:示 RRM2 在 HCC 組織(t)及其癌旁組織(u)中表達的免疫組化染色圖(IHC ×100)及其評分結果(v)
2.4 核心 DEGs 生存分析結果
將 19 個核心 DEGs 經過 Kaplan-Meier Plotter 生存分析后,發現有 9 個核心 DEGs [核糖核苷酸還原酶調節亞基 M2(RRM2)、胞質分裂蛋白調節因子 1(PRC1)、DNA 拓撲異構酶Ⅱα(TOP2A)、極光激酶 A(AURKA)、核仁和紡錘體相關蛋白 1(NUSAP1)、Rac GTP 酶激活蛋白 1(RACGAP1)、紡錘體微管組裝因子(ASPM)、細胞周期蛋白依賴性激酶 1(CDK1)、GINS 復合體 1(GINS1)] 的生存分析滿足 P<0.05(圖 1b–1j);另外 10 個核心 DEGs [(細胞色素 P450 2E1(CYP2E1)、細胞色素 P450 1A2(CYP1A2)、細胞色素 P450 4A11(CYP4A11)、細胞色素 P450 26A1(CYP26A1)、細胞色素 P450 2C8(CYP2C8)、細胞色素 P450 3A4(CYP3A4)、細胞色素 P450 2B6(CYP2B6)、細胞色素 P450 2A6(CYP2A6)、細胞色素 P450 2C9(CYP2C9)、N-乙酰基轉移酶 2(NAT2)] 的生存分析差異無統計學意義(P>0.05)。
2.5 9 個與預后相關的 DEGs 在 HCC 癌組織及其癌旁組織中的表達情況
將上述 9 個與預后相關的 DEGs 通過 GEPIA 進行表達量分析,結果顯示:9 個 DEGs 在 HCC 組織中的表達較癌旁組織高,其差異具有統計學意義(P<0.05),見圖 1k–1s。
2.6 與預后相關且在 HCC 中高表達的 DEGs 的功能及通路富集分析結果
將上述 9 個在 HCC 組織中高表達的 DEGs 經 Metascape 在線分析,得到功能和通路的富集分析主要集中表現在細胞分裂、細胞周期的調節、雌配子的產生、生長發育和 PID PLKI 通路方面,詳見表 4。

2.7 RRM2 在 HCC 組織和癌旁組織中免疫組化染色結果
在篩選出來的 9 個核心 DEGs 中選取 RRM2,采用 IHC 方法檢測其在 HCC 組織和癌旁組織中的表達情況:RRM2 在 HCC 組織中的染色評分為(10.9±1.5)分,明顯高于其在癌旁組織中的染色評分 [(4.5±1.2)分],P<0.001,見圖 1t–1v。
3 討論
近年來隨著生物信息學的蓬勃發展,大量基因芯片應用于研究疾病的發生發展、靶向基因的篩選等方面。HCC 的發生發展涉及基因、環境、飲食等多種因素的共同作用過程,利用生物信息學技術準確篩選出導致 HCC 發生發展的關鍵基因,這對于 HCC 的早期診斷和精準靶向治療提供了重要依據。本研究基于生物信息學分析在 GEO 數據庫中篩選出近幾年且樣本量較大的 3 份 HCC 及癌旁組織基因芯片,并在多個生物信息分析網站中進行了系統全面的分析,最終得出 RRM2、PRC1、TOP2A、AURKA、NUSAP1、RACGAP1、ASPM、CDK1 和 GINS1 基因與 HCC 的發生發展有重要關系。篩選出的這 9 個基因主要作用于細胞分裂、細胞周期的調節、PID PLKI 通路、雌配子的產生和生長發育等方面,從而引起細胞周期的紊亂、基因的突變,最終導致腫瘤的發生發展。
人核糖核苷酸還原酶(human ribonucleotide reductase,RR)是細胞內催化核糖核苷二磷酸轉化為脫氧核糖核苷二磷酸的限速酶。RR 由 2 個相同的亞基組成,即核糖核苷酸還原酶調節亞基 M1(RRM1)和核糖核苷酸還原酶調節亞基 M2(RRM1),RRM1 的表達水平在細胞周期中相對穩定,而 RRM2 的表達僅發生在 G1 期晚期和 S 期早期,在 DNA 合成和修復中發揮重要作用,并被發現與腫瘤的進展有關[8-9]。RRM2 在多種腫瘤中均有表達,有研究[10]發現,在口咽癌中,RRM2 的過表達促進了腫瘤細胞的生長,并對腫瘤細胞的整體血管生成活性產生了積極的影響。Lu 等[11]通過對 56 對結直腸癌組織和正常組織的分析發現,RRM2 在結直腸癌的浸潤和轉移中起重要作用。在食管癌中,RRM2 在耐藥食管癌組織中的表達明顯高于敏感食管癌組織,且 RRM2 的表達強陽性與總生存期短相關[12]。在腹膜后脂肪瘤中,RRM2 在腹膜后脂肪瘤中高表達,下調 RRM2 通過 Akt/mTOR/4EBP1 通路抑制細胞增殖,抑制細胞遷移和侵襲,促進細胞凋亡,從而抑制腹膜后脂肪瘤進展[13]。在口腔鱗癌中,RRM2 在原發性口腔鱗癌組織中的表達明顯高于正常組織和異常增生組織,且其過度表達與口腔鱗癌的病理分級有關,RRM2 高表達患者的總體生存率低于 RRM2 低表達患者,RRM2 的過度表達與口腔鱗癌復發密切相關,其過度表達與腫瘤干細胞(CSCs)標志物 CD44、ALDH1 及 EMT 標志物 Slug 相關,RRM2 的表達促進了人口腔鱗癌細胞的增殖和遷移,抑制了細胞凋亡[14]。在乳腺癌細胞中,RRM2 高表達,microRNA-4500 通過下調 RRM2,抑制 MAPK 信號通路的激活,從而減弱乳腺癌細胞的增殖、侵襲、遷移和血管生成,促進乳腺癌細胞凋亡[15];反義 RNA1(TTN-AS1)通過抑制 miR-524-5p,上調 RRM2 的表達,在乳腺癌中發揮致癌作用[16]。在前列腺癌中,RRM2 信號基因表達增加與前列腺癌的復發、高 Gleason 評分和致死率顯著相關,是侵襲性前列腺癌的主要驅動力[17]。在多發性骨髓瘤中,多發性骨髓瘤組 RRM2 mRNA 表達水平和 RRM2 蛋白表達水平均明顯高于對照組,RRM2 的表達水平與骨破壞和髓外浸潤密切相關,RRM2 下調抑制細胞增殖,使細胞周期阻滯在 S 期而抑制細胞增殖[18]。
PRC1 在肝細胞癌中參與 Wnt/β-catenin 信號通路促進肝細胞癌的轉移和復發,參與 p53 通路發揮原癌基因作用[19]。TOP2A 目前已經被證實在肝細胞癌中參與了幾種與癌癥相關的關鍵途徑,包括“p53 途徑” “癌癥途徑”和“細胞凋亡信號傳導途徑” [20],從而發揮了原癌基因作用,也是靶向治療中的一個重要靶點。目前已有針對 AURKA 靶點的研究,且初步取得了成功[21]。Dauch 等[22]已經證實 AURKA 是 HCC 的一個有效的藥物靶點,其發揮的原癌基因作用已經探究明確,與本研究芯片分析結果一致。NUSAP1 目前已經研究證實,其可通過調節 CDK1 和 DLGAP5 的表達,抑制浸潤性乳腺癌細胞的增殖[23],也有報道稱 NUSAP1 的下調可以抑制 HCC 的功能[24],但是并未明確地探討其所涉及的機制。RACGAP1 在肝細胞癌中通過降低 Hippo 信號來促進細胞分裂,導致癌細胞的增殖[25];也有研究[26]顯示,可能是參與 ECT/Rho/ERK 信號通路促進癌細胞的增值。近年的研究[27-28]也發現,RACGAP1 可以作為 HCC 的一個重要生物靶點。ASPM 可以通過 Wnt-Dvl-3-β-catenin 通路,促進前列腺癌的發生、發展[29]。在 HCC 中,有研究[30]表明,通過共表達分析,ASPM 可能通過調節腫瘤相關的磷酸化與 HCV 肝硬化的進展相關。但是尚未有進一步的研究。CDK1 的過度表達也被發現與 HCC 的門靜脈侵犯、甲胎蛋白水平高和預后不良直接相關[31]。近年的一項研究[32]發現,二甲雙胍可以通過誘導 G2/M 期阻滯來顯著抑制 HCC 細胞的增殖,并能有效地降低 CDK1 的表達,提示 CDK1 可能參與了 HCC 細胞周期中的細胞增殖過程。GINS1 在 DNA 的復制過程中起關鍵作用,是腫瘤干細胞干性的一個標志基因[33]。Lian 等[34]提出單個的 GINS 亞基或 GINS 復合物整體上可能是 HCC 的潛在預后生物標志物。
在 HCC 中,本研究通過選擇 3 組基因芯片共 192 例 HCC 組織和 142 例癌旁組織的基因表達量分析發現,RRM2 在 HCC 組織中的表達明顯高于正常組織,后期的生存分析曲線顯示 RRM2 高表達患者的生存時間較 RRM2 低表達患者明顯縮短。事實上,RRM2 的上調與 HCC 較差的存活率相關[35],這與本研究結果一致。SCY1 樣結合蛋白 1(SCY1-like 1-binding protein 1,SCYL1-BP1)通過 RRM2 和 Cyclin F 影響 HCC 細胞周期阻滯[36]。小干擾 RNA 介導的 RRM2 基因敲除可抑制 HCC 細胞增殖[37]。有研究[38-39]表明,乙型肝炎病毒(HBV)可以通過激活 DNA 損傷反應來誘導 RRM2 的表達,靶向 RRM2 可以有效地抑制 HBV 的復制。這些研究表明,RRM2 可能被確定為 HBV 相關 HCC 的治療靶點。此外,Lee 等[35]指出,RRM2 的高表達可作為預測 HCC 根治性切除術后早期復發的有用指標。綜上研究數據表明,RRM2 可能成為 HCC 的潛在治療靶點。但上述數據均來源于生物信息學,數據信息混雜、缺乏足夠實驗基礎,所以,本研究選取 RRM2 在本研究中心 70 例 HCC 組織和癌旁組織中進行驗證,其結果顯示,RRM2 在 HCC 組織中的表達評分為(10.861 8±1.452 7)分,在癌旁組織中的表達評分為(4.479 3±1.153 4)分,前者明顯高于后者,其差異具有統計學意義(P<0.001),與預期結果相符。
綜上所述,本研究基于生物信息學分析發現 RRM2、PRC1、TOP2A、AURKA、NUSAP1、RACGAP1、ASPM、CDK1 和 GINS1 基因可能是 HCC 發生發展的重要基因,且涉及細胞分裂、細胞周期調節、PID PLKI 通路、雌配子的產生和生長發育等方面。同時,本研究還選取 RRM2 在 HCC 組織和癌旁組織中進行驗證,發現在 HCC 組織中 RRM2 的表達高于癌旁組織,與本研究通過生物信息學研究所得的表達量結果相符。這 9 個 HCC 相關基因均在 HCC 的發生和發展過程中具有重要的作用,有望成為 HCC 篩查及治療的新靶點,同時也將為研究 HCC 的發生發展提供一定的理論基礎。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:王何斌、劉德欽、楊茂輝、應偉、周國俊、馮彥超和鐘曉蓉負責研究設計、數據處理及論文撰寫;李文菠和冷政偉主要負責論文的審查及修改。
倫理聲明:本研究已通過川北醫學院附屬醫院倫理委員會審批 [批文編號:2021ER(A)009]。
肝細胞癌(hepatocellular carcinoma,HCC)是消化系統最常見的惡性腫瘤之一,據美國癌癥協會統計,HCC 在男性腫瘤中的發病率排第 6 位,但在女性中仍以每年超過 2% 的速度增長,其病死率在男性排第 5 位,在女性排第 6 位[1]。與其他腫瘤相似,HCC 的發生與其潛在的危險因素包括肥胖、酗酒、乙型肝炎病毒(HBV)及丙型肝炎病毒(HCV)感染、非酒精性脂肪性肝病、某些基因突變等[2-3]。雖然近年來 HCC 的治療取得了很大進展,但其預后仍不理想,其主要原因是早期診斷困難、復發和轉移[4]。越來越多的證據表明,基因異常表達與 HCC 的啟動和預后不良有關[5-6]。因此,準確找到導致 HCC 的相關基因,從基因水平上研究 HCC 已成為研究熱點之一。
近年來,利用生物信息學和基因芯片技術研究因基因失活或突變所致腫瘤的發生發展已成為發展趨勢[7]。基因芯片具有數據全面、樣本量大等優點,在生物學及醫學領域占據重要位置。但這些數據信息混雜、缺乏足夠實驗基礎,因此如何挖掘出準確可靠的基因信息成為了生物信息學研究熱點。本研究通過生物信息學方法對 HCC 及其癌旁組織的基因芯片中的差異基因進行分析并進行臨床樣本表達驗證,旨在篩選出與 HCC 發生發展的關鍵基因,為 HCC 的早期診斷、靶向治療等提供參考。
1 資料與方法
1.1 芯片數據信息來源
HCC 芯片從 NCBI-GEO(
1.2 差異表達基因(differentially expressed genes,DEGs)篩選
通過 GEO2R 在線工具(
1.3 GO 功能分析和 KEGG 通路富集分析
利用生物學信息注釋數據庫(database for annotation,visualization and integrated discovery,DAVID)對 DEGs 進行系統綜合的生物學功能注釋分析。將 DEGs 上傳到 DAVID 數據庫(
1.4 蛋白相互作用網絡(PPI)分析和核心 DEGs 篩選
將所獲得的 DEGs 用 STRING(https://string-db.org)進行 PPI 網絡圖的構建,構建后的網絡圖利用 Cytoscape3.7.2 軟件及 MCODE 插件分析,篩選出核心 DEGs。MCODE 分析設置條件:度數截斷值=2,節點分數截斷值=0.2,K-分數=2,最大深度=100。
1.5 核心 DEGs 生存分析
通過 Kaplan-Meier Plotter 數據庫(
1.6 與預后相關的 DEGs 在癌組織及其癌旁組織中的表達情況分析
將通過 Kaplan-Meier Plotter 數據庫篩選出的與預后相關的 DEGs 通過 GEPIA 數據庫(
1.7 與預后相關且在 HCC 中高表達 DEGs 的功能及通路富集分析
將獲得的與預后相關且在 HCC 中高表達的 DEGs 上傳至基因富集分析網站 Mmetascape(
1.8 免疫組織化學染色
選取川北醫學院附屬醫院肝膽外二科近 5 年手術切除的 HCC 組織和癌旁組織標本各 70 例用于免疫組化染色(IHC)觀察 RRM2 在組織中的表達情況:所取組織標本石蠟包埋,5 μm 切片,使用標準的免疫過氧化物酶染色程序進行 IHC 分析。抗 RRM2 一抗(購買自 Signaway Antibody 有限公司)的使用濃度為 1∶50。根據切片的染色強度計分:1 個視野中著色細胞少于 25% 判為陰性、0 分;著色細胞 25%~50% 判為弱陽性、1 分,著色細胞 50%~75% 判為陽性、2 分,著色細胞>75% 判為強陽性、3 分;再根據陽性細胞所占百分比計分:陽性細胞所占百分比<5% 計 0 分;5%~25% 計 1 分;25%~50% 計 2 分;50%~75% 計 3 分;>75% 計 4 分。最終以染色強度計分與陽性細胞所占百分比計分的乘積作為免疫組化染色結果,為 0~12 分,以 6 分為界限分為低表達樣本和高表達樣本。然后使用 SPSS 分別對 HCC 組織和癌旁組織的染色評分進行數據統計,再把統計數據導入 GraphPad prism8 軟件中繪制統計圖。
1.9 統計學方法
對 RRM2 在 HCC 組織及其癌旁組織中進行驗證,其結果采用 SPPS 統計軟件對數據進行分析。計量數據符合正態分布,數據用均數±標準差(±s)表示,采用 t 檢驗。檢驗水準 α=0.05。
2 結果
2.1 DEGs 篩選結果
在 3 個基因芯片 GSE14520、GSE60502 和 GSE102079 分別篩選出 DEGs 277 個、321 個和 204 個,其中上調的 DEGs 分別為 57 個、123 個和 56 個,下調的 DEGs 分別為 220 個、198 個和 148 個,3 個基因芯片的共差異上調基因有 16 個,共差異下調基因有 78 個,94 個共表達的 DEGs 詳見表 1。

2.2 94 個共表達的 DEGs 的 GO 功能分析和 KEGG 通路富集分析結果
2.2.1 GO 功能分析結果
94 個共表達的 DEGs 的 GO 功能分析結果見表 2。由表 2 可見,其 BP 共涉及 43 個方面,主要集中在 P450 表氧化酶通路、外源性藥物代謝過程、異型生物質的代謝過程、細胞負增長的調控、類固醇代謝過程、細胞對鎘離子反應、氧化還原過程、細胞對鋅離子的反應等;MF 共有 17 個相關方面,其中主要集中于氧化還原酶活性、血紅素結合、鐵離子結合、花生四烯酸環氧合酶活性、單加氧酶活性、甾體羥化酶活性、咖啡因氧化酶活性、芳香酶活性等;CC 共涉及 15 個方面,其中有統計學意義的有細胞器膜、血液微粒、細胞外區、細胞外泌體、細胞外間隙、內質網膜、IgM 免疫球蛋白復合物、六聚體 IgG 免疫球蛋白復合物和胰島素樣生長因子結合蛋白復合物。

2.2.2 KEGG 通路富集分析結果
94 個共表達的 DEGs 的 KEGG 通路富集分析結果見表 3。由表 3 可見,共涉及 11 個通路,包括視黃醇代謝、藥物代謝-細胞色素 P450、化學致癌性、細胞色素 P450 對外源性藥物的代謝、亞油酸代謝、代謝途徑、礦物質吸收、咖啡因代謝、甾體類激素生物合成、花生四烯酸代謝、糖酵解-糖異生 P53 信號通路。

2.3 PPI 網絡分析及核心 DEGs 篩選結果
將 94 個 DEGs 通過 STRING 分析構建 PPI 網絡圖,有 8 個基因未出現在 PPI 網絡中,剩余的 86 個基因包括上調基因 16 個和下調基因 70 個,再用 Cytoscape 3.7.2 軟件分析后,因為有 9 個基因與其他基因無任何聯系,所以未出現在 PPI 網絡中,得到 77 個 DEGs,共有蛋白之間相互作用關系線條 193 條,經 MCODE 插件分析后得到 2 簇相交點最多的基因簇,分別有上調基因 9 個和下調基因 10 個、有 36 條及 40 條線,其分值分別為 9.000 和 8.889,將其定義為核心 DEGs。19 個核心 DEGs 見圖 1a。

a:示 77 個共表達 DEGs 的 PPI 圖及核心 DEGs 篩選結果,紅色方框內為上調核心 DEGs;紫色方框內為下調核心 DEGs;1b–1j:示 9 個有統計學意義的核心 DEGs 生存分析結果;1k–1s:示 9 個 DEGs 在 HCC 組織及其癌旁組織中表達情況;1t–1v:示 RRM2 在 HCC 組織(t)及其癌旁組織(u)中表達的免疫組化染色圖(IHC ×100)及其評分結果(v)
2.4 核心 DEGs 生存分析結果
將 19 個核心 DEGs 經過 Kaplan-Meier Plotter 生存分析后,發現有 9 個核心 DEGs [核糖核苷酸還原酶調節亞基 M2(RRM2)、胞質分裂蛋白調節因子 1(PRC1)、DNA 拓撲異構酶Ⅱα(TOP2A)、極光激酶 A(AURKA)、核仁和紡錘體相關蛋白 1(NUSAP1)、Rac GTP 酶激活蛋白 1(RACGAP1)、紡錘體微管組裝因子(ASPM)、細胞周期蛋白依賴性激酶 1(CDK1)、GINS 復合體 1(GINS1)] 的生存分析滿足 P<0.05(圖 1b–1j);另外 10 個核心 DEGs [(細胞色素 P450 2E1(CYP2E1)、細胞色素 P450 1A2(CYP1A2)、細胞色素 P450 4A11(CYP4A11)、細胞色素 P450 26A1(CYP26A1)、細胞色素 P450 2C8(CYP2C8)、細胞色素 P450 3A4(CYP3A4)、細胞色素 P450 2B6(CYP2B6)、細胞色素 P450 2A6(CYP2A6)、細胞色素 P450 2C9(CYP2C9)、N-乙酰基轉移酶 2(NAT2)] 的生存分析差異無統計學意義(P>0.05)。
2.5 9 個與預后相關的 DEGs 在 HCC 癌組織及其癌旁組織中的表達情況
將上述 9 個與預后相關的 DEGs 通過 GEPIA 進行表達量分析,結果顯示:9 個 DEGs 在 HCC 組織中的表達較癌旁組織高,其差異具有統計學意義(P<0.05),見圖 1k–1s。
2.6 與預后相關且在 HCC 中高表達的 DEGs 的功能及通路富集分析結果
將上述 9 個在 HCC 組織中高表達的 DEGs 經 Metascape 在線分析,得到功能和通路的富集分析主要集中表現在細胞分裂、細胞周期的調節、雌配子的產生、生長發育和 PID PLKI 通路方面,詳見表 4。

2.7 RRM2 在 HCC 組織和癌旁組織中免疫組化染色結果
在篩選出來的 9 個核心 DEGs 中選取 RRM2,采用 IHC 方法檢測其在 HCC 組織和癌旁組織中的表達情況:RRM2 在 HCC 組織中的染色評分為(10.9±1.5)分,明顯高于其在癌旁組織中的染色評分 [(4.5±1.2)分],P<0.001,見圖 1t–1v。
3 討論
近年來隨著生物信息學的蓬勃發展,大量基因芯片應用于研究疾病的發生發展、靶向基因的篩選等方面。HCC 的發生發展涉及基因、環境、飲食等多種因素的共同作用過程,利用生物信息學技術準確篩選出導致 HCC 發生發展的關鍵基因,這對于 HCC 的早期診斷和精準靶向治療提供了重要依據。本研究基于生物信息學分析在 GEO 數據庫中篩選出近幾年且樣本量較大的 3 份 HCC 及癌旁組織基因芯片,并在多個生物信息分析網站中進行了系統全面的分析,最終得出 RRM2、PRC1、TOP2A、AURKA、NUSAP1、RACGAP1、ASPM、CDK1 和 GINS1 基因與 HCC 的發生發展有重要關系。篩選出的這 9 個基因主要作用于細胞分裂、細胞周期的調節、PID PLKI 通路、雌配子的產生和生長發育等方面,從而引起細胞周期的紊亂、基因的突變,最終導致腫瘤的發生發展。
人核糖核苷酸還原酶(human ribonucleotide reductase,RR)是細胞內催化核糖核苷二磷酸轉化為脫氧核糖核苷二磷酸的限速酶。RR 由 2 個相同的亞基組成,即核糖核苷酸還原酶調節亞基 M1(RRM1)和核糖核苷酸還原酶調節亞基 M2(RRM1),RRM1 的表達水平在細胞周期中相對穩定,而 RRM2 的表達僅發生在 G1 期晚期和 S 期早期,在 DNA 合成和修復中發揮重要作用,并被發現與腫瘤的進展有關[8-9]。RRM2 在多種腫瘤中均有表達,有研究[10]發現,在口咽癌中,RRM2 的過表達促進了腫瘤細胞的生長,并對腫瘤細胞的整體血管生成活性產生了積極的影響。Lu 等[11]通過對 56 對結直腸癌組織和正常組織的分析發現,RRM2 在結直腸癌的浸潤和轉移中起重要作用。在食管癌中,RRM2 在耐藥食管癌組織中的表達明顯高于敏感食管癌組織,且 RRM2 的表達強陽性與總生存期短相關[12]。在腹膜后脂肪瘤中,RRM2 在腹膜后脂肪瘤中高表達,下調 RRM2 通過 Akt/mTOR/4EBP1 通路抑制細胞增殖,抑制細胞遷移和侵襲,促進細胞凋亡,從而抑制腹膜后脂肪瘤進展[13]。在口腔鱗癌中,RRM2 在原發性口腔鱗癌組織中的表達明顯高于正常組織和異常增生組織,且其過度表達與口腔鱗癌的病理分級有關,RRM2 高表達患者的總體生存率低于 RRM2 低表達患者,RRM2 的過度表達與口腔鱗癌復發密切相關,其過度表達與腫瘤干細胞(CSCs)標志物 CD44、ALDH1 及 EMT 標志物 Slug 相關,RRM2 的表達促進了人口腔鱗癌細胞的增殖和遷移,抑制了細胞凋亡[14]。在乳腺癌細胞中,RRM2 高表達,microRNA-4500 通過下調 RRM2,抑制 MAPK 信號通路的激活,從而減弱乳腺癌細胞的增殖、侵襲、遷移和血管生成,促進乳腺癌細胞凋亡[15];反義 RNA1(TTN-AS1)通過抑制 miR-524-5p,上調 RRM2 的表達,在乳腺癌中發揮致癌作用[16]。在前列腺癌中,RRM2 信號基因表達增加與前列腺癌的復發、高 Gleason 評分和致死率顯著相關,是侵襲性前列腺癌的主要驅動力[17]。在多發性骨髓瘤中,多發性骨髓瘤組 RRM2 mRNA 表達水平和 RRM2 蛋白表達水平均明顯高于對照組,RRM2 的表達水平與骨破壞和髓外浸潤密切相關,RRM2 下調抑制細胞增殖,使細胞周期阻滯在 S 期而抑制細胞增殖[18]。
PRC1 在肝細胞癌中參與 Wnt/β-catenin 信號通路促進肝細胞癌的轉移和復發,參與 p53 通路發揮原癌基因作用[19]。TOP2A 目前已經被證實在肝細胞癌中參與了幾種與癌癥相關的關鍵途徑,包括“p53 途徑” “癌癥途徑”和“細胞凋亡信號傳導途徑” [20],從而發揮了原癌基因作用,也是靶向治療中的一個重要靶點。目前已有針對 AURKA 靶點的研究,且初步取得了成功[21]。Dauch 等[22]已經證實 AURKA 是 HCC 的一個有效的藥物靶點,其發揮的原癌基因作用已經探究明確,與本研究芯片分析結果一致。NUSAP1 目前已經研究證實,其可通過調節 CDK1 和 DLGAP5 的表達,抑制浸潤性乳腺癌細胞的增殖[23],也有報道稱 NUSAP1 的下調可以抑制 HCC 的功能[24],但是并未明確地探討其所涉及的機制。RACGAP1 在肝細胞癌中通過降低 Hippo 信號來促進細胞分裂,導致癌細胞的增殖[25];也有研究[26]顯示,可能是參與 ECT/Rho/ERK 信號通路促進癌細胞的增值。近年的研究[27-28]也發現,RACGAP1 可以作為 HCC 的一個重要生物靶點。ASPM 可以通過 Wnt-Dvl-3-β-catenin 通路,促進前列腺癌的發生、發展[29]。在 HCC 中,有研究[30]表明,通過共表達分析,ASPM 可能通過調節腫瘤相關的磷酸化與 HCV 肝硬化的進展相關。但是尚未有進一步的研究。CDK1 的過度表達也被發現與 HCC 的門靜脈侵犯、甲胎蛋白水平高和預后不良直接相關[31]。近年的一項研究[32]發現,二甲雙胍可以通過誘導 G2/M 期阻滯來顯著抑制 HCC 細胞的增殖,并能有效地降低 CDK1 的表達,提示 CDK1 可能參與了 HCC 細胞周期中的細胞增殖過程。GINS1 在 DNA 的復制過程中起關鍵作用,是腫瘤干細胞干性的一個標志基因[33]。Lian 等[34]提出單個的 GINS 亞基或 GINS 復合物整體上可能是 HCC 的潛在預后生物標志物。
在 HCC 中,本研究通過選擇 3 組基因芯片共 192 例 HCC 組織和 142 例癌旁組織的基因表達量分析發現,RRM2 在 HCC 組織中的表達明顯高于正常組織,后期的生存分析曲線顯示 RRM2 高表達患者的生存時間較 RRM2 低表達患者明顯縮短。事實上,RRM2 的上調與 HCC 較差的存活率相關[35],這與本研究結果一致。SCY1 樣結合蛋白 1(SCY1-like 1-binding protein 1,SCYL1-BP1)通過 RRM2 和 Cyclin F 影響 HCC 細胞周期阻滯[36]。小干擾 RNA 介導的 RRM2 基因敲除可抑制 HCC 細胞增殖[37]。有研究[38-39]表明,乙型肝炎病毒(HBV)可以通過激活 DNA 損傷反應來誘導 RRM2 的表達,靶向 RRM2 可以有效地抑制 HBV 的復制。這些研究表明,RRM2 可能被確定為 HBV 相關 HCC 的治療靶點。此外,Lee 等[35]指出,RRM2 的高表達可作為預測 HCC 根治性切除術后早期復發的有用指標。綜上研究數據表明,RRM2 可能成為 HCC 的潛在治療靶點。但上述數據均來源于生物信息學,數據信息混雜、缺乏足夠實驗基礎,所以,本研究選取 RRM2 在本研究中心 70 例 HCC 組織和癌旁組織中進行驗證,其結果顯示,RRM2 在 HCC 組織中的表達評分為(10.861 8±1.452 7)分,在癌旁組織中的表達評分為(4.479 3±1.153 4)分,前者明顯高于后者,其差異具有統計學意義(P<0.001),與預期結果相符。
綜上所述,本研究基于生物信息學分析發現 RRM2、PRC1、TOP2A、AURKA、NUSAP1、RACGAP1、ASPM、CDK1 和 GINS1 基因可能是 HCC 發生發展的重要基因,且涉及細胞分裂、細胞周期調節、PID PLKI 通路、雌配子的產生和生長發育等方面。同時,本研究還選取 RRM2 在 HCC 組織和癌旁組織中進行驗證,發現在 HCC 組織中 RRM2 的表達高于癌旁組織,與本研究通過生物信息學研究所得的表達量結果相符。這 9 個 HCC 相關基因均在 HCC 的發生和發展過程中具有重要的作用,有望成為 HCC 篩查及治療的新靶點,同時也將為研究 HCC 的發生發展提供一定的理論基礎。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:王何斌、劉德欽、楊茂輝、應偉、周國俊、馮彥超和鐘曉蓉負責研究設計、數據處理及論文撰寫;李文菠和冷政偉主要負責論文的審查及修改。
倫理聲明:本研究已通過川北醫學院附屬醫院倫理委員會審批 [批文編號:2021ER(A)009]。