引用本文: 賈宇, 陳彥, 劉建生. MCM 基因家族在肝細胞癌中的生存預測價值分析. 中國普外基礎與臨床雜志, 2021, 28(7): 898-903. doi: 10.7507/1007-9424.202010026 復制
肝細胞癌(HCC)是目前世界范圍內第五大常見的惡性腫瘤,也是癌癥病死的第二大原因[1]。中國是肝癌的高發地區之一,全球每年新發 HCC 患者將近一半來自我國[2]。隨著近年來醫學技術水平的快速發展,HCC 的治療措施取得了很大的進展,手術切除、介入治療、靶向治療、免疫治療等給患者帶來了希望[3]。然而,病情進展快、高復發率和高轉移率仍嚴重威脅患者的長期生存。因此,探索肝癌發病過程中的潛在分子機制,研究有價值的生物標志物來預測 HCC 患者的預后,從而指導臨床治療決策的制定,合理利用醫療資源,使患者獲益最大化,一定程度上將有助于改善患者的臨床結局。微小染色體維持蛋白(minichromosome maintenance protein,MCM)在真核細胞 DNA 復制的起始階段中發揮了重要作用,保障了細胞周期和增殖過程的正常運行[4]。MCM 基因家族成員包括 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8、MCM9 和 MCM10[5]。研究表明,MCM 基因家族可以預測腫瘤細胞的增殖和進展,具有重要的診斷和預后預測價值,在多個腫瘤(包括:乳腺癌[6]、肺癌[7]、腦膜瘤[8]、胃癌[9]等)中被認為其異常表達影響預后。盡管在肝癌中,已有部分研究者注意到了 MCM 基因家族的異常表達,但是目前對其異常表達與預后的研究還較少、不夠全面。本研究將基于公共數據庫的大樣本信息,回顧性分析研究 MCM 基因家族在 HCC 中表達水平的生存預測價值。
1 資料和方法
1.1 數據獲取
從癌癥基因組圖譜(The Cancer Genome Atlas,TCGA,
1.2 MCM 基因家族的差異表達分析
從轉錄組測序數據中提取 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8、MCM9 和 MCM10 的表達量數據,應用 R 語言的 limma 包分析鑒定這 9 個基因在 HCC 組織和正常肝組織中的差異表達情況,符合∣log2FC∣>2 [FC(fold change)即基因表達量的差異倍數]且錯誤發現率(false discovery rate,FDR)<0.05 的基因被認為是差異表達的 MCM 基因。用 R 語言的 pheatmap 包繪制聚類熱圖以呈現各個基因在樣本中的表達情況。
1.3 以 MCM 基因家族構建預后模型
應用 survival 包對在 HCC 患者中差異表達的 MCM 基因擬合單因素 Cox 比例風險回歸模型,將 P<0.05 的基因作為有預后意義的基因納入多因素 Cox 比例風險回歸模型,通過對所有預后相關的基因進行組合,采用赤池信息準則(Akaike information criterion,AIC)值最小的原則,獲得最佳組合的預后模型。根據預后模型的回歸系數,將會得到 MCM 基因家族表達風險評分公式。風險評分=基因 1 回歸系數×基因 1 表達水平+基因 2 回歸系數×基因 2 表達水平+…+基因 n 回歸系數×基因 n 表達水平,計算出每例 HCC 患者的風險評分。
根據風險評分的中位(M)值將所有患者劃分為高風險組和低風險組,繪制風險熱圖和風險曲線。應用 Kaplan-Meier 法繪制生存曲線,采用log-rank 法分析高低風險組的預后差異。
1.4 風險評分的獨立性分析
為了明確在控制其他混雜因素下,風險評分對預后的影響,將 HCC 患者的年齡(連續變量)、性別(男和女)、病理分級(G1、G2、G3 和 G4)、TNM 分期(Ⅰ期、Ⅱ期、Ⅲ期、Ⅳ期)、T 分期(TNM 分期中的 T 分期,指腫瘤大小或侵犯范圍,分為 T1、T2、T3、T4)和風險評分(連續變量)納入單因素和多因素 Cox 比例風險回歸模型,探索預后的影響因素。
1.5 列線圖的構建與評價
列線圖是回歸模型結果的可視化,不僅可以便捷、快速地應用于臨床評估患者的生存概率,而且通過納入更多對預后有影響的因素,從而提高預測能力和預測準確性。將單因素 Cox 比例風險回歸模型中所有有統計學意義的因素均納入用以構建列線圖,由此來預測 HCC 患者的 3 年和 5 年生存概率。為了評價列線圖的預測能力及預測準確性,通過計算一致性指數(consistency index,C 指數)來比較預測結果和實際結果的一致性,并繪制 3 年和 5 年校正曲線。再通過 3 年、5 年的時間依賴性受試者工作特征(receiver operating characteristic,ROC)曲線及曲線下面積(AUC)值來評價列線圖的預測能力。
1.6 基因富集功能分析(gene set enrichment analysis,GSEA)
使用 GSEA 軟件對高風險評分患者所表達的基因進行京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。篩選校正后富集分數(NES)>1、P<0.05、FDR<0.05 為顯著的通路。
1.7 統計學方法
數據分析和繪圖由 R 3.6.3、GraphPad Prism 8.0 及 GSEA 4.1.0 完成。用 Wilcoxon 秩和檢驗比較 HCC 組織和正常肝組織間的基因表達差異;采用 Cox 比例風險回歸模型進行預后影響因素的單因素和多因素分析;采用 log-rank 法比較高風險評分和低風險評分患者的預后。檢驗水準 α=0.05。
2 結果
2.1 MCM 基因家族在 HCC 組織和正常肝組織中的差異表達
從 TCGA 數據庫中下載得到了 374 例 HCC 組織和 50 例正常肝組織的轉錄組測序數據,提取 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8、MCM9 和 MCM10 的表達量進行差異分析,結果除了 MCM9 以外的 8 個基因均存在表達差異,且在腫瘤組織中表達上調(log2FC>2 且 FDR<0.05),見圖 1a。

a:MCM 基因在 HCC 組織和正常肝組織中差異表達,N 代表正常肝組織,T 代表 HCC 組織,顏色越紅表達水平越高,顏色越藍表達水平越低;b:所有 HCC 患者風險評分的分布,按從小到大排列,以
2.2 MCM 基因家族預后價值的分析及預后模型構建
有370例 HCC 患者同時具有轉錄組數據和生存信息,在該部分患者中進行 MCM 基因的 Cox 比例風險回歸分析。由單因素分析結果可知,上述 8 個差異表達的 MCM 基因對 HCC 患者預后的影響均具有統計學意義(P<0.05)。多因素分析結果表明,MCM6 和 MCM10 是影響 HCC 患者的獨立影響因素,高表達患者的預后更差(HR>1,P<0.05),見表 1。

通過多因素 Cox 比例風險回歸模型構建預后模型(通過對 8 個基因隨機組合,計算每個組合的 AIC 值,當 AIC 值最小時獲得了擬合最優的預后模型),本研究得到了預后模型的最佳組合方式,當 AIC 值最小時(AIC=1 304.07),模型由 3 個基因構成:MCM6、MCM8 和 MCM10。根據預后模型的回歸系數,得出 MCM 基因家族的風險評分公式:風險評分=(0.035×MCM6 表達水平)+(0.471×MCM10 表達水平)–(0.218×MCM8 表達水平),見表 1。
根據風險評分計算公式計算出每例 HCC 患者的風險評分,以中位風險值(M=0.850)為截斷值將所有患者劃分為高風險組(風險評分>M)和低風險組(風險評分≤M)。圖 1b、1c 反映了高低風險組患者的風險評分分布以及生存狀態分布。圖 1d 反映了高風險組患者的 MCM6、MCM8 和 MCM10 的表達水平均高于低風險組患者。log-rank 結果顯示,高風險組患者的預后差于低風險組患者(χ2=7.572,P<0.001),見圖 1e。
2.3 基于風險評分構建列線圖預測患者的生存概率
將 HCC 患者的性別、年齡、病理分級、TNM 分期、T 分期和風險評分納入 Cox 比例風險回歸模型進行單因素和多因素分析。單因素分析結果顯示,TNM 分期、T 分期和風險評分是 HCC 患者預后的影響因素(P<0.001);多因素分析結果表明,風險評分是影響 HCC 患者預后的獨立危險因素,且高評分的患者的預后差 [HR=1.433,95%CI(1.258,1.633),P<0.001],見表 2。

將前面單因素 Cox 比例風險模型中有統計學意義的 TNM 分期、T 分期和風險評分構建列線圖,得到可以預測 HCC 患者 3 年、5 年生存概率的列線圖。根據列線圖,把 HCC 患者相關信息的每一項得分相加后得到總分,總分在標尺上對應的概率即為 3 年、5 年生存概率(圖 1f)。
內部重抽樣驗證計算出 C 指數為 0.723,表示列線圖的預測結果和真實結果具有較好的一致性。繪制 3 年和 5 年的校正曲線(圖 1g、1h)反映預測結果和實際結果間的差異,藍線代表預測結果,對角線虛線代表實際結果,結果顯示,預測結果非常接近真實結果,這說明本研究構建的列線圖預測 HCC 患者 3 年和 5 年生存概率是相對可靠的。繪制 3 年、5 年的時間依賴性 ROC 曲線并計算 AUC,發現列線圖的預測能力要優于單純 TNM 分期、T 分期以及風險評分(3 年和5 年AUC 分別為 0.731 和 0.704),見圖 1i、1j。
2.4 高風險評分患者的 KEGG 通路富集
對高風險評分患者所表達的基因進行通路富集分析顯示,其排名前 10 位的顯著富集通路有:細胞周期、堿基切除修復、RNA 降解、卵母細胞減數分裂、嘌呤代謝、孕激素介導的卵母細胞成熟、嘧啶代謝、核苷酸切除修復、DNA 復制和剪接體(圖 1k)。這些通路中的部分通路(如細胞周期、DNA 復制)與 MCM 基因家族的已知功能相一致,其在高風險評分患者中顯著富集也正好與高風險患者中高表達 MCM 基因相對應。
3 討論
探索肝癌發生、發展過程中的關鍵基因將有助于肝癌的診斷、尋找潛在的治療靶點和預測患者的生存狀態。正常細胞轉變為腫瘤細胞的基本特征之一是細胞增殖失去控制,而細胞失控性增殖與細胞周期的調控機制失常密切相關[10]。MCM 基因家族在 DNA 復制過程中發揮了關鍵作用,尤其是在 DNA 復制的起始和延伸階段,功能或表達失調的 MCM 基因將可能導致基因組的不穩定性和細胞周期進程失去控制,促進了細胞異常增殖并由此增加腫瘤發生風險[11]。MCM 基因家族中,MCM2、MCM3、MCM4、MCM5、MCM6 和 MCM7 6 個蛋白形成穩定的六聚體復合物 MCM2~7,是真核生物 DNA 復制解旋酶的核心[12]。在細胞周期 G1 期,MCM2~7 復合物被招募到染色體標記的復制起始點上,從而完成復制起始的“標記”和“許可”,并促進復制前復合物(pre-RC)的形成[13];進入 S 期后,復制解旋酶的功能被激活,DNA 雙鏈被解開,復制過程啟動[14];在 S 期末和 G2 期,MCM2~7 復合物與染色質分離[5]。MCM8 和 MCM9 主要存在于脊椎動物中,有研究[15]表明,MCM8~9 復合物有類似于 MCM2~7 復合物的功能,當缺乏 MCM2 時,MCM8~9 復合物可以替代發揮解旋酶的功能,可以緩解 DNA 復制的壓力。MCM10 是否屬于 MCM 基因家族還存在一些爭議,但是其功能與 MCM 家族非常接近,且與 DNA 復制過程密切相關[16]。MCM10 不具有酶活性,其在 DNA 復制過程中主要發揮促進 DNA 解旋、促進 DNA 延伸等作用,而且會影響基因組的穩定性[17]。MCM10 在 G1 期裝載到 DNA 上,進入 S 期后促進 DNA 解旋酶激活和 DNA 聚合酶加載,是復制過程啟動不可缺少的條件[18]。
Liu 等[19]對 102 例 HCC 組織和癌旁正常組織的研究中,發現 HCC 組織中 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8 和 MCM10 均表達上調,而且驗證了 MCM6 表達上調與不良的預后顯著相關,這與本研究得出的結論一致。此外有研究[20]表明,血清中 MCM6 的表達水平有望成為 HCC 的生物標志物,可以將 HCC 患者與健康人、肝硬化患者區分開,并可預測 HCC 早期復發。在胰腺癌中,MCM8 被鑒定為是影響胰腺癌預后的獨立危險因素[21]。敲除或抑制 MCM8 基因的表達有助于增加腫瘤細胞對順鉑和奧拉帕尼的敏感性[22]。目前對 MCM10 和惡性腫瘤關系的研究還較少,在宮頸癌中發現過表達的 MCM10 與預后不良相關[23];在前列腺癌中發現敲低 MCM10 基因的表達抑制了腫瘤細胞的增殖,高表達水平與患者較差的預后顯著相關[24]。
本研究通過生物信息學方法,回顧性研究了 TCGA 數據庫中 MCM 基因家族在 HCC 患者中的表達及其生存預測價值,結果顯示,在 HCC 組織中 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8 和 MCM10 高表達,而且單因素分析結果表明高表達的上述基因水平與預后不良有關;多因素 Cox 比例風險回歸模型結果表明,MCM6 和 MCM10 是 HCC 患者的獨立預后因素,并構建出一個由 MCM6、MCM8 和 MCM10 組成的預后模型,由此得到了 MCM 基因家族表達風險評分的計算公式,根據公式計算出每例患者的風險評分,結果高風險評分患者的預后要差于低風險評分患者。基于風險評分構建了一個可以預測 3 年和 5 年生存概率的列線圖,經驗證其預測結果具有較好的準確性和可靠性,且列線圖具有簡單、直觀、實用性強、方便臨床應用等優勢。
本研究也存在一定的局限性,首先,預后模型及列線圖的構建是基于回顧性分析得出的,其預測效能還有待在其他獨立樣本及前瞻性研究中進行檢驗;其次,MCM 基因在 HCC 發病、進展過程中發揮的功能及其參與的作用機制還有待深入研究。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:賈宇參與數據分析、撰寫和修改文章;陳彥參與數據分析;劉建生參與論文指導和修改。
肝細胞癌(HCC)是目前世界范圍內第五大常見的惡性腫瘤,也是癌癥病死的第二大原因[1]。中國是肝癌的高發地區之一,全球每年新發 HCC 患者將近一半來自我國[2]。隨著近年來醫學技術水平的快速發展,HCC 的治療措施取得了很大的進展,手術切除、介入治療、靶向治療、免疫治療等給患者帶來了希望[3]。然而,病情進展快、高復發率和高轉移率仍嚴重威脅患者的長期生存。因此,探索肝癌發病過程中的潛在分子機制,研究有價值的生物標志物來預測 HCC 患者的預后,從而指導臨床治療決策的制定,合理利用醫療資源,使患者獲益最大化,一定程度上將有助于改善患者的臨床結局。微小染色體維持蛋白(minichromosome maintenance protein,MCM)在真核細胞 DNA 復制的起始階段中發揮了重要作用,保障了細胞周期和增殖過程的正常運行[4]。MCM 基因家族成員包括 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8、MCM9 和 MCM10[5]。研究表明,MCM 基因家族可以預測腫瘤細胞的增殖和進展,具有重要的診斷和預后預測價值,在多個腫瘤(包括:乳腺癌[6]、肺癌[7]、腦膜瘤[8]、胃癌[9]等)中被認為其異常表達影響預后。盡管在肝癌中,已有部分研究者注意到了 MCM 基因家族的異常表達,但是目前對其異常表達與預后的研究還較少、不夠全面。本研究將基于公共數據庫的大樣本信息,回顧性分析研究 MCM 基因家族在 HCC 中表達水平的生存預測價值。
1 資料和方法
1.1 數據獲取
從癌癥基因組圖譜(The Cancer Genome Atlas,TCGA,
1.2 MCM 基因家族的差異表達分析
從轉錄組測序數據中提取 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8、MCM9 和 MCM10 的表達量數據,應用 R 語言的 limma 包分析鑒定這 9 個基因在 HCC 組織和正常肝組織中的差異表達情況,符合∣log2FC∣>2 [FC(fold change)即基因表達量的差異倍數]且錯誤發現率(false discovery rate,FDR)<0.05 的基因被認為是差異表達的 MCM 基因。用 R 語言的 pheatmap 包繪制聚類熱圖以呈現各個基因在樣本中的表達情況。
1.3 以 MCM 基因家族構建預后模型
應用 survival 包對在 HCC 患者中差異表達的 MCM 基因擬合單因素 Cox 比例風險回歸模型,將 P<0.05 的基因作為有預后意義的基因納入多因素 Cox 比例風險回歸模型,通過對所有預后相關的基因進行組合,采用赤池信息準則(Akaike information criterion,AIC)值最小的原則,獲得最佳組合的預后模型。根據預后模型的回歸系數,將會得到 MCM 基因家族表達風險評分公式。風險評分=基因 1 回歸系數×基因 1 表達水平+基因 2 回歸系數×基因 2 表達水平+…+基因 n 回歸系數×基因 n 表達水平,計算出每例 HCC 患者的風險評分。
根據風險評分的中位(M)值將所有患者劃分為高風險組和低風險組,繪制風險熱圖和風險曲線。應用 Kaplan-Meier 法繪制生存曲線,采用log-rank 法分析高低風險組的預后差異。
1.4 風險評分的獨立性分析
為了明確在控制其他混雜因素下,風險評分對預后的影響,將 HCC 患者的年齡(連續變量)、性別(男和女)、病理分級(G1、G2、G3 和 G4)、TNM 分期(Ⅰ期、Ⅱ期、Ⅲ期、Ⅳ期)、T 分期(TNM 分期中的 T 分期,指腫瘤大小或侵犯范圍,分為 T1、T2、T3、T4)和風險評分(連續變量)納入單因素和多因素 Cox 比例風險回歸模型,探索預后的影響因素。
1.5 列線圖的構建與評價
列線圖是回歸模型結果的可視化,不僅可以便捷、快速地應用于臨床評估患者的生存概率,而且通過納入更多對預后有影響的因素,從而提高預測能力和預測準確性。將單因素 Cox 比例風險回歸模型中所有有統計學意義的因素均納入用以構建列線圖,由此來預測 HCC 患者的 3 年和 5 年生存概率。為了評價列線圖的預測能力及預測準確性,通過計算一致性指數(consistency index,C 指數)來比較預測結果和實際結果的一致性,并繪制 3 年和 5 年校正曲線。再通過 3 年、5 年的時間依賴性受試者工作特征(receiver operating characteristic,ROC)曲線及曲線下面積(AUC)值來評價列線圖的預測能力。
1.6 基因富集功能分析(gene set enrichment analysis,GSEA)
使用 GSEA 軟件對高風險評分患者所表達的基因進行京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。篩選校正后富集分數(NES)>1、P<0.05、FDR<0.05 為顯著的通路。
1.7 統計學方法
數據分析和繪圖由 R 3.6.3、GraphPad Prism 8.0 及 GSEA 4.1.0 完成。用 Wilcoxon 秩和檢驗比較 HCC 組織和正常肝組織間的基因表達差異;采用 Cox 比例風險回歸模型進行預后影響因素的單因素和多因素分析;采用 log-rank 法比較高風險評分和低風險評分患者的預后。檢驗水準 α=0.05。
2 結果
2.1 MCM 基因家族在 HCC 組織和正常肝組織中的差異表達
從 TCGA 數據庫中下載得到了 374 例 HCC 組織和 50 例正常肝組織的轉錄組測序數據,提取 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8、MCM9 和 MCM10 的表達量進行差異分析,結果除了 MCM9 以外的 8 個基因均存在表達差異,且在腫瘤組織中表達上調(log2FC>2 且 FDR<0.05),見圖 1a。

a:MCM 基因在 HCC 組織和正常肝組織中差異表達,N 代表正常肝組織,T 代表 HCC 組織,顏色越紅表達水平越高,顏色越藍表達水平越低;b:所有 HCC 患者風險評分的分布,按從小到大排列,以
2.2 MCM 基因家族預后價值的分析及預后模型構建
有370例 HCC 患者同時具有轉錄組數據和生存信息,在該部分患者中進行 MCM 基因的 Cox 比例風險回歸分析。由單因素分析結果可知,上述 8 個差異表達的 MCM 基因對 HCC 患者預后的影響均具有統計學意義(P<0.05)。多因素分析結果表明,MCM6 和 MCM10 是影響 HCC 患者的獨立影響因素,高表達患者的預后更差(HR>1,P<0.05),見表 1。

通過多因素 Cox 比例風險回歸模型構建預后模型(通過對 8 個基因隨機組合,計算每個組合的 AIC 值,當 AIC 值最小時獲得了擬合最優的預后模型),本研究得到了預后模型的最佳組合方式,當 AIC 值最小時(AIC=1 304.07),模型由 3 個基因構成:MCM6、MCM8 和 MCM10。根據預后模型的回歸系數,得出 MCM 基因家族的風險評分公式:風險評分=(0.035×MCM6 表達水平)+(0.471×MCM10 表達水平)–(0.218×MCM8 表達水平),見表 1。
根據風險評分計算公式計算出每例 HCC 患者的風險評分,以中位風險值(M=0.850)為截斷值將所有患者劃分為高風險組(風險評分>M)和低風險組(風險評分≤M)。圖 1b、1c 反映了高低風險組患者的風險評分分布以及生存狀態分布。圖 1d 反映了高風險組患者的 MCM6、MCM8 和 MCM10 的表達水平均高于低風險組患者。log-rank 結果顯示,高風險組患者的預后差于低風險組患者(χ2=7.572,P<0.001),見圖 1e。
2.3 基于風險評分構建列線圖預測患者的生存概率
將 HCC 患者的性別、年齡、病理分級、TNM 分期、T 分期和風險評分納入 Cox 比例風險回歸模型進行單因素和多因素分析。單因素分析結果顯示,TNM 分期、T 分期和風險評分是 HCC 患者預后的影響因素(P<0.001);多因素分析結果表明,風險評分是影響 HCC 患者預后的獨立危險因素,且高評分的患者的預后差 [HR=1.433,95%CI(1.258,1.633),P<0.001],見表 2。

將前面單因素 Cox 比例風險模型中有統計學意義的 TNM 分期、T 分期和風險評分構建列線圖,得到可以預測 HCC 患者 3 年、5 年生存概率的列線圖。根據列線圖,把 HCC 患者相關信息的每一項得分相加后得到總分,總分在標尺上對應的概率即為 3 年、5 年生存概率(圖 1f)。
內部重抽樣驗證計算出 C 指數為 0.723,表示列線圖的預測結果和真實結果具有較好的一致性。繪制 3 年和 5 年的校正曲線(圖 1g、1h)反映預測結果和實際結果間的差異,藍線代表預測結果,對角線虛線代表實際結果,結果顯示,預測結果非常接近真實結果,這說明本研究構建的列線圖預測 HCC 患者 3 年和 5 年生存概率是相對可靠的。繪制 3 年、5 年的時間依賴性 ROC 曲線并計算 AUC,發現列線圖的預測能力要優于單純 TNM 分期、T 分期以及風險評分(3 年和5 年AUC 分別為 0.731 和 0.704),見圖 1i、1j。
2.4 高風險評分患者的 KEGG 通路富集
對高風險評分患者所表達的基因進行通路富集分析顯示,其排名前 10 位的顯著富集通路有:細胞周期、堿基切除修復、RNA 降解、卵母細胞減數分裂、嘌呤代謝、孕激素介導的卵母細胞成熟、嘧啶代謝、核苷酸切除修復、DNA 復制和剪接體(圖 1k)。這些通路中的部分通路(如細胞周期、DNA 復制)與 MCM 基因家族的已知功能相一致,其在高風險評分患者中顯著富集也正好與高風險患者中高表達 MCM 基因相對應。
3 討論
探索肝癌發生、發展過程中的關鍵基因將有助于肝癌的診斷、尋找潛在的治療靶點和預測患者的生存狀態。正常細胞轉變為腫瘤細胞的基本特征之一是細胞增殖失去控制,而細胞失控性增殖與細胞周期的調控機制失常密切相關[10]。MCM 基因家族在 DNA 復制過程中發揮了關鍵作用,尤其是在 DNA 復制的起始和延伸階段,功能或表達失調的 MCM 基因將可能導致基因組的不穩定性和細胞周期進程失去控制,促進了細胞異常增殖并由此增加腫瘤發生風險[11]。MCM 基因家族中,MCM2、MCM3、MCM4、MCM5、MCM6 和 MCM7 6 個蛋白形成穩定的六聚體復合物 MCM2~7,是真核生物 DNA 復制解旋酶的核心[12]。在細胞周期 G1 期,MCM2~7 復合物被招募到染色體標記的復制起始點上,從而完成復制起始的“標記”和“許可”,并促進復制前復合物(pre-RC)的形成[13];進入 S 期后,復制解旋酶的功能被激活,DNA 雙鏈被解開,復制過程啟動[14];在 S 期末和 G2 期,MCM2~7 復合物與染色質分離[5]。MCM8 和 MCM9 主要存在于脊椎動物中,有研究[15]表明,MCM8~9 復合物有類似于 MCM2~7 復合物的功能,當缺乏 MCM2 時,MCM8~9 復合物可以替代發揮解旋酶的功能,可以緩解 DNA 復制的壓力。MCM10 是否屬于 MCM 基因家族還存在一些爭議,但是其功能與 MCM 家族非常接近,且與 DNA 復制過程密切相關[16]。MCM10 不具有酶活性,其在 DNA 復制過程中主要發揮促進 DNA 解旋、促進 DNA 延伸等作用,而且會影響基因組的穩定性[17]。MCM10 在 G1 期裝載到 DNA 上,進入 S 期后促進 DNA 解旋酶激活和 DNA 聚合酶加載,是復制過程啟動不可缺少的條件[18]。
Liu 等[19]對 102 例 HCC 組織和癌旁正常組織的研究中,發現 HCC 組織中 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8 和 MCM10 均表達上調,而且驗證了 MCM6 表達上調與不良的預后顯著相關,這與本研究得出的結論一致。此外有研究[20]表明,血清中 MCM6 的表達水平有望成為 HCC 的生物標志物,可以將 HCC 患者與健康人、肝硬化患者區分開,并可預測 HCC 早期復發。在胰腺癌中,MCM8 被鑒定為是影響胰腺癌預后的獨立危險因素[21]。敲除或抑制 MCM8 基因的表達有助于增加腫瘤細胞對順鉑和奧拉帕尼的敏感性[22]。目前對 MCM10 和惡性腫瘤關系的研究還較少,在宮頸癌中發現過表達的 MCM10 與預后不良相關[23];在前列腺癌中發現敲低 MCM10 基因的表達抑制了腫瘤細胞的增殖,高表達水平與患者較差的預后顯著相關[24]。
本研究通過生物信息學方法,回顧性研究了 TCGA 數據庫中 MCM 基因家族在 HCC 患者中的表達及其生存預測價值,結果顯示,在 HCC 組織中 MCM2、MCM3、MCM4、MCM5、MCM6、MCM7、MCM8 和 MCM10 高表達,而且單因素分析結果表明高表達的上述基因水平與預后不良有關;多因素 Cox 比例風險回歸模型結果表明,MCM6 和 MCM10 是 HCC 患者的獨立預后因素,并構建出一個由 MCM6、MCM8 和 MCM10 組成的預后模型,由此得到了 MCM 基因家族表達風險評分的計算公式,根據公式計算出每例患者的風險評分,結果高風險評分患者的預后要差于低風險評分患者。基于風險評分構建了一個可以預測 3 年和 5 年生存概率的列線圖,經驗證其預測結果具有較好的準確性和可靠性,且列線圖具有簡單、直觀、實用性強、方便臨床應用等優勢。
本研究也存在一定的局限性,首先,預后模型及列線圖的構建是基于回顧性分析得出的,其預測效能還有待在其他獨立樣本及前瞻性研究中進行檢驗;其次,MCM 基因在 HCC 發病、進展過程中發揮的功能及其參與的作用機制還有待深入研究。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:賈宇參與數據分析、撰寫和修改文章;陳彥參與數據分析;劉建生參與論文指導和修改。