引用本文: 黃康, 彭貴主. 基于生物信息學分析肝細胞癌的核心基因. 中國普外基礎與臨床雜志, 2020, 27(11): 1357-1364. doi: 10.7507/1007-9424.202002087 復制
肝癌是我國最常見的惡性腫瘤之一,主要包括兩種病理組織學類型,分別為肝細胞癌(hepato- cellular carcinoma,HCC)和肝內膽管細胞癌(intrahepatic cholangiocarcinoma,iCCA),HCC 占我國肝癌總數的 83.9%~92.3%[1]。慢性乙肝病毒(hepatitis B virus,HBV)感染是導致我國肝癌發生的最主要原因,約 85% 的 HCC 患者攜帶 HBV 感染標志物[2]。肝癌由于預后差、死亡率高、不易早期診斷等特征,常被稱為“癌中之王” [1]。據統計,全球每年約有 70 萬例左右的新發肝癌患者,其中大約有 35 萬肝癌患者在中國[3-4]。目前,原發性肝癌的主要治療方案有手術切除、靶向藥物、肝移植、放射治療、化療等[4]。肝癌的外科治療已經取得了較大進步,術后 5 年生存率提高到 30%~40%[4]。但與其他消化道惡性腫瘤相比,肝癌的外科治療效果并不能令人滿意,主要原因是腫瘤復發與轉移[3-5]。因此,亟需深入研究肝癌的發病機制,尋找敏感性高和特異性強的腫瘤標志物,以期為肝癌的早期診斷、有效治療及預后判斷提供更為可靠的依據。目前,以高通量測序技術為基礎的生物信息學研究可以全面分析基因表達的變化,已成為癌癥發病機制研究的重要手段。本研究擬通過檢索 GEO 數據庫中的相關高通量轉錄組芯片數據集,系統篩選肝癌和癌旁組織的轉錄組基因芯片表達譜,并進行差異基因的功能富集分析,篩選具有臨床意義的核心基因進行深入研究,為肝癌的發生機制研究提供依據。
1 資料和方法
1.1 數據來源
通過檢索 GEO 數據庫(
1.2 篩選差異性表達基因(DEGs)
本研究使用基于 R 語言和 t 檢驗的統計分析工具 GEO2R(
1.3 GO 分析和 KEGG 通路分析
基因本體論(GO,
1.4 核心基因互作網絡分析
STRING(The Search Tool for the Retrieval of Interacting Genes,
1.5 基因表達與病理分期的相關性分析
GEPIA(
1.6 免疫組織化學
人類蛋白質圖集(The Humen Protein Atlas,
1.7 GSEA 富集分析
GSEA(
2 結果
2.1 DEGs 的篩選
在分析 GSE101728 數據集后篩選出 1 082 個 DEGs,包括 354 個上調基因和 728 個下調基因。本研究將上調最顯著的 30 個基因和下調最顯著的 30 個基因進行聚類分析并繪制聚類分析圖(圖1a)。另外,本研究繪制了此芯片 DEGs 的火山圖(圖1b)。

a:差異表達分析最大的 60 個基因(30 個上調差異基因+30 個下調差異基因)的聚類分析圖;b:GSE101728 芯片 DEGs 分析的火山圖;c:10 個核心基因的 PPI 網絡圖;d–m:10 個核心基因在 HCC 組織和正常肝組織中的表達差異,包括 AURKB(d)、CCNA2(e)、CCNB1(f)、CCNB2(g)、CDC20(h)、CDK1(i)、CENPA(j)、KIF2C(k)、MAD2L1(l)和 PLK1(m),其中 HCC 組織樣本量為 369,正常肝組織樣本量為 160,* 表示
2.2 核心基因互作網絡分析、GO 分析和 KEGG 通路分析
本研究通過 STRING 構建所有 DEGs 的互作關系(圖1c)并將基因的互作關系導入 Cytoscape 進行連接度分析,其中,周期素依賴性激酶 1(CDK1)、細胞周期蛋白 B1(CCNB1)、細胞周期蛋白 A2(CCNA2)、polo 樣激酶 1(PLK1)、激光激酶 B(AURKB)、細胞分裂周期蛋白 20(CDC20)、著絲粒蛋白 A(CENPA)、有絲分裂阻滯缺陷蛋白 2(MAD2L1)、細胞周期蛋白 B2(CCNB2)和驅動蛋白家族 2C(KIF2C)為連接度最大的 10 個基因,即核心基因(表1)。GO 分析和 KEGG 通路分析結果均提示,10 個核心基因主要參與細胞周期和細胞分裂(表2和表3)。



2.3 基因表達水平與患者預后的關系
本研究通過 GEPIA 驗證核心基因在 HCC 組織中的表達水平(圖1d–1m),結果顯示,與正常肝組織比較,10 個核心基因在 HCC 組織中均呈高表達(P<0.05)。同時探討了核心基因與 HCC 患者總生存期(OS)和無進展生存期(DFS)的關系(圖2),結果表明,除 CCNB2 外,其余 9 個核心基因高表達組患者的 OS 情況差于低表達組患者(P<0.05);10 個核心基因的高表達組患者的 DFS 情況差于低表達組患者(P<0.05)。另外,本研究還發現,10 個核心基因的表達均與 HCC 臨床分期相關(P<0.05),見圖3a–3j。

a–j:AURKB(a)、CCNA2(b)、CCNB1(c)、CCNB2(d)、CDC20(e)、CDK1(f)、CENPA(g)、KIF2C(h)、MAD2L1(i)、PLK1(j)基因高表達組和低表達組的 OS 曲線;k–t:AURKB(k)、CCNA2(l)、c:CCNB1(m)、CCNB2(n)、CDC20(o)、CDK1(p)、CENPA(q)、KIF2C(r)、MAD2L1(s)、PLK1(t)基因高表達組和低表達組的 DFS 曲線

a–j:AURKB(a)、CCNA2(b)、CCNB1(c)、CCNB2(d)、CDC20(e)、CDK1(f)、CENPA(g)、KIF2C(h)、MAD2L1(i)、PLK1(j)在 HCC 組織中的表達與病理分期相關;k–m:CCNB1 和 MAD2L1(k)、CCNB1 和 AURKB(l)、AURKB 和 MAD2L1(m)的表達水平均存在相關性;n:AURKB 基因集富集分析(GSEA)示在 G2/M 檢查點富集,NES 值為–2.79,FDR q 值為 0,NOM q 值為 0;o:AURKB 基因集富集分析(GSEA)示在有絲分裂紡錘體富集,NES 值為–2.03,FDR q 值為 0,NOM q 值為 0
2.4 基因表達之間的相關性及 GSEA 分析
通過 STRING 構建核心基因的 PPI 網絡(圖1c),進一步分析核心基因間的相關性,結果顯示,AURKB、CCNB1 和 MAD2L1 兩兩在 HCC 組織中的表達均具有明顯的正相關性(樣本量=369,P<0.001),見圖3k–3m,因此本研究只分析了該 3 個基因的免疫組織化學結果。本研究通過 The Human Protein Atlas 分析 HCC 組織中 AURKB、CCNB1 和 MAD2L1 的免疫組織化學結果,發現3 個核心基因在 HCC 組織中的表達水平均明顯高于正常肝組織。通過 GSEA 進行分析,本研究發現,AURKB(圖 3n 和3o)、CCNB1 和 MAD2L1 在 G2/M 檢查點(G2_checkpoint)和細胞分裂紡錘體(mitotic spindle)2 個生物學過程明顯富集。
3 討論
近幾十年來,HCC 的死亡率在全球范圍內呈上升趨勢。盡管診斷和治療方法已經取得了許多進步,但是肝癌的預后仍然很差。因此,迫切需要尋找肝癌的特異性和敏感生物標志物及治療靶點。生物信息學結合高通量測序可以系統地對疾病相關基因進行全面分析,是研究疾病發病機制的重要手段。
本研究就肝癌 GSE101728 微陣列表達譜分析數據集中的 7 例 HCC 組織樣本和 7 例癌旁組織樣本,總共獲得 1 082 個 DEGs,涉及 354 個上調基因和 728 個下調基因。為了系統地探索這些 DEGs,本研究對這些 DEGs 進行了 PPI 網絡分析后獲取 10 個網絡的核心節點基因(核心基因),并進行 GO 功能和 KEGG 通路分析。之后,本研究通過 GEPIA 數據庫對 10 個核心基因進行驗證,發現 10 個核心基因在肝癌組織中的表達水平均明顯高于正常的肝組織,提示 10 個核心基因具有肝癌病理診斷的臨床價值;進一步分析 10 個核心基因與肝癌患者預后的相關性,經 log-rank 分析發現,除 CCNB2 外,其余 9 個核心基因高表達患者的 OS 情況明顯差于低表達的患者,且 10 個核心基因高表達患者的 DFS 情況明顯差于低表達的患者,進一步提示了 10 個核心基因的表達有助于肝癌患者的預后評估。由此筆者推測,CDK1、CCNB1、CCNA2、PLK1、AURKB、CDC20、CENPA、CCNB2、MAD2L1 和 KIF2C 可能是肝癌潛在的治療靶點及預后標志物。在細胞分裂中,基因組通過自身復制的方式將遺傳物質傳給每個子代細胞,使每個子代細胞攜帶母代基因組信息。該過程由多種機制控制以確保正確的細胞分裂[8]。各種細胞周期蛋白的異常激活導致不受機體控制的增殖是惡性腫瘤的特性之一[9-10]。因此,深入研究細胞分裂相關基因在肝癌發生發展中的具體機制,對肝癌的治療具有廣闊的前景。
CDK1,也稱為 CDC2,是一種絲氨酸/蘇氨酸激酶,主要參與細胞周期和 RNA 轉錄。有研究[11]表明,CDK1 在肝癌組織中過度表達,下調其的表達可將肝癌細胞阻滯在 G2/M 階段。另有報道[12],二甲雙胍促進 miR-378 的表達后,通過靶向抑制 CDK1 的表達進而抑制 HCC 細胞的增殖。此外,還有研究[13]報道,在臨床Ⅰ期研究中,CDK1 的抑制劑 Terameprocol 對白血病晚期患者的預后具有一定的改善作用。
B 型細胞周期蛋白家族包括 CCNB1 和 CCNB2,這兩種蛋白質的 N 末端區域在結構上有所不同,相似度為 57%[14]。CCNB1 和 CCNB2 共表達在大多數分裂的細胞中,并與 CDK1 一起調節細胞 G2/M 階段。在肺癌細胞中,CCNB2 過表達通過改變紡錘體檢查點導致染色體不穩定。CCNB1 參與細胞周期調控,它在各種癌癥類型中均明顯過表達[15]。另有研究[16-17]表明,CCNB1 促進細胞增殖、腫瘤生長和癌癥復發,并與癌癥的進展和生存有關。CCNA2 與 CDK1 形成二聚體,參與調節 S 期進程和 G2/M 的過渡[18]。
PLK 是一組高度保守的絲氨酸/蘇氨酸激酶,PLK1 是該家族成員之一,主要參與有絲分裂和細胞周期進程,調節紡錘體組裝和染色體分離,促進 DNA 復制,并參與胞質分裂和減數分裂,PLK1 對于精確調節細胞分裂并維持有絲分裂、紡錘體裝配和 DNA 損傷反應中的基因組穩定性至關重要[19-20]。Weiss 等[21]通過臨床試驗發現,PLK1 特異性抑制劑 NMS-1286937通過抑制有絲分裂,對晚期實體腫瘤具有一定的療效。
AURKB 也是一種絲氨酸/蘇氨酸激酶,是有絲分裂過程的關鍵調節酶之一。極光激酶(AURK)家族由 AURKA、AURKB 和 AURKC 組成[22]。據報道,AURKB 在肝癌組織中高表達[23]。AURKB 的高表達與腫瘤侵襲和轉移有關,且與癌癥患者的預后不良有關[24]。在臨床試驗研究中,AURKB 激酶的選擇性抑制劑 Barasertib 在多種晚期實體瘤中具有抗腫瘤特性[25]。
CDC20 作為紡錘體裝配檢查點和細胞周期后期促進復合物(APC/C)的活化劑,能夠調控細胞周期。APC/CDC20 在細胞中期到后期的過渡過程中還通過調節各種關鍵的細胞周期調節因子而發揮關鍵作用[26]。除了調節細胞周期外,還有證據[27]表明,CDC20 在人類腫瘤發生和癌癥進展中起著重要作用。CDC20 的異常表達使 APC/C 異常活化并促進不成熟的細胞周期后期的形成,這將導致兩個子細胞中的有絲分裂異常和非整倍體形成[26]。
研究[28]表明,MAD2L1 在 HCC 組織中的表達明顯較高,并且與預后不良有關,且 miR-200c-5p 通過下調 MAD2L1 抑制 HCC 細胞的增殖、遷移和侵襲。KIF2C 是一種與有絲分裂著絲粒相關的驅動蛋白,在雙極紡錘體的組裝中起重要作用[29]。Chen 等[30]發現,KIF2C 與肝癌組織病理分級和 TNM 分期之間具有明顯相關性,進一步的生存分析發現,其與 HCC 患者的 OS 和 DFS 顯著相關。CENPA 是類著絲粒相關蛋白,作為組蛋白 H3 的變體,在 G1/S 期中參與著絲粒組裝[31]。Takada 等[32]發現,CENPA 受細胞周期蛋白 E1/CDK2 調控,并通過影響染色體的不穩定性而導致腫瘤發生。
由此,筆者發現,CDK1、CCNB1、CCNA2、PLK1、AURKB、CDC20、CENPA、MAD2L1、CCNB2 和 KIF2C 在細胞分裂中起重要的調節作用。目前,根據近些年文獻報道,可以發現本研究篩選的 10 個基因確實與細胞周期密切相關。本研究進行的 GO 和 KEGG 分析發現的一些結果,目前研究比較少,比如 CCNB1、CDK1 和 CCNB2 參與 p53 信號通路的調節;CCNB1、CCNB2 和 PLK1 參與 FoxO 信號通路;CDK1、CDC20 和 CCNA2 參與病毒的致癌作用,AURKB、CCNB1 和 MAD2L1 基因間具有較強的相關性等,需進一步驗證。
本研究通過生物信息學的方法初步分析其在肝癌組織中的表達并探討了其在肝癌發生發展中的潛在機制,下一步筆者團隊將設計相關實驗進一步研究相關信號通路,探討 AURKB、CCNB1 和 MAD2L1 之間是否具有調控關系等。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:黃康負責研究設計、數據處理及論文撰寫,彭貴主負責論文的審查及修改。
肝癌是我國最常見的惡性腫瘤之一,主要包括兩種病理組織學類型,分別為肝細胞癌(hepato- cellular carcinoma,HCC)和肝內膽管細胞癌(intrahepatic cholangiocarcinoma,iCCA),HCC 占我國肝癌總數的 83.9%~92.3%[1]。慢性乙肝病毒(hepatitis B virus,HBV)感染是導致我國肝癌發生的最主要原因,約 85% 的 HCC 患者攜帶 HBV 感染標志物[2]。肝癌由于預后差、死亡率高、不易早期診斷等特征,常被稱為“癌中之王” [1]。據統計,全球每年約有 70 萬例左右的新發肝癌患者,其中大約有 35 萬肝癌患者在中國[3-4]。目前,原發性肝癌的主要治療方案有手術切除、靶向藥物、肝移植、放射治療、化療等[4]。肝癌的外科治療已經取得了較大進步,術后 5 年生存率提高到 30%~40%[4]。但與其他消化道惡性腫瘤相比,肝癌的外科治療效果并不能令人滿意,主要原因是腫瘤復發與轉移[3-5]。因此,亟需深入研究肝癌的發病機制,尋找敏感性高和特異性強的腫瘤標志物,以期為肝癌的早期診斷、有效治療及預后判斷提供更為可靠的依據。目前,以高通量測序技術為基礎的生物信息學研究可以全面分析基因表達的變化,已成為癌癥發病機制研究的重要手段。本研究擬通過檢索 GEO 數據庫中的相關高通量轉錄組芯片數據集,系統篩選肝癌和癌旁組織的轉錄組基因芯片表達譜,并進行差異基因的功能富集分析,篩選具有臨床意義的核心基因進行深入研究,為肝癌的發生機制研究提供依據。
1 資料和方法
1.1 數據來源
通過檢索 GEO 數據庫(
1.2 篩選差異性表達基因(DEGs)
本研究使用基于 R 語言和 t 檢驗的統計分析工具 GEO2R(
1.3 GO 分析和 KEGG 通路分析
基因本體論(GO,
1.4 核心基因互作網絡分析
STRING(The Search Tool for the Retrieval of Interacting Genes,
1.5 基因表達與病理分期的相關性分析
GEPIA(
1.6 免疫組織化學
人類蛋白質圖集(The Humen Protein Atlas,
1.7 GSEA 富集分析
GSEA(
2 結果
2.1 DEGs 的篩選
在分析 GSE101728 數據集后篩選出 1 082 個 DEGs,包括 354 個上調基因和 728 個下調基因。本研究將上調最顯著的 30 個基因和下調最顯著的 30 個基因進行聚類分析并繪制聚類分析圖(圖1a)。另外,本研究繪制了此芯片 DEGs 的火山圖(圖1b)。

a:差異表達分析最大的 60 個基因(30 個上調差異基因+30 個下調差異基因)的聚類分析圖;b:GSE101728 芯片 DEGs 分析的火山圖;c:10 個核心基因的 PPI 網絡圖;d–m:10 個核心基因在 HCC 組織和正常肝組織中的表達差異,包括 AURKB(d)、CCNA2(e)、CCNB1(f)、CCNB2(g)、CDC20(h)、CDK1(i)、CENPA(j)、KIF2C(k)、MAD2L1(l)和 PLK1(m),其中 HCC 組織樣本量為 369,正常肝組織樣本量為 160,* 表示
2.2 核心基因互作網絡分析、GO 分析和 KEGG 通路分析
本研究通過 STRING 構建所有 DEGs 的互作關系(圖1c)并將基因的互作關系導入 Cytoscape 進行連接度分析,其中,周期素依賴性激酶 1(CDK1)、細胞周期蛋白 B1(CCNB1)、細胞周期蛋白 A2(CCNA2)、polo 樣激酶 1(PLK1)、激光激酶 B(AURKB)、細胞分裂周期蛋白 20(CDC20)、著絲粒蛋白 A(CENPA)、有絲分裂阻滯缺陷蛋白 2(MAD2L1)、細胞周期蛋白 B2(CCNB2)和驅動蛋白家族 2C(KIF2C)為連接度最大的 10 個基因,即核心基因(表1)。GO 分析和 KEGG 通路分析結果均提示,10 個核心基因主要參與細胞周期和細胞分裂(表2和表3)。



2.3 基因表達水平與患者預后的關系
本研究通過 GEPIA 驗證核心基因在 HCC 組織中的表達水平(圖1d–1m),結果顯示,與正常肝組織比較,10 個核心基因在 HCC 組織中均呈高表達(P<0.05)。同時探討了核心基因與 HCC 患者總生存期(OS)和無進展生存期(DFS)的關系(圖2),結果表明,除 CCNB2 外,其余 9 個核心基因高表達組患者的 OS 情況差于低表達組患者(P<0.05);10 個核心基因的高表達組患者的 DFS 情況差于低表達組患者(P<0.05)。另外,本研究還發現,10 個核心基因的表達均與 HCC 臨床分期相關(P<0.05),見圖3a–3j。

a–j:AURKB(a)、CCNA2(b)、CCNB1(c)、CCNB2(d)、CDC20(e)、CDK1(f)、CENPA(g)、KIF2C(h)、MAD2L1(i)、PLK1(j)基因高表達組和低表達組的 OS 曲線;k–t:AURKB(k)、CCNA2(l)、c:CCNB1(m)、CCNB2(n)、CDC20(o)、CDK1(p)、CENPA(q)、KIF2C(r)、MAD2L1(s)、PLK1(t)基因高表達組和低表達組的 DFS 曲線

a–j:AURKB(a)、CCNA2(b)、CCNB1(c)、CCNB2(d)、CDC20(e)、CDK1(f)、CENPA(g)、KIF2C(h)、MAD2L1(i)、PLK1(j)在 HCC 組織中的表達與病理分期相關;k–m:CCNB1 和 MAD2L1(k)、CCNB1 和 AURKB(l)、AURKB 和 MAD2L1(m)的表達水平均存在相關性;n:AURKB 基因集富集分析(GSEA)示在 G2/M 檢查點富集,NES 值為–2.79,FDR q 值為 0,NOM q 值為 0;o:AURKB 基因集富集分析(GSEA)示在有絲分裂紡錘體富集,NES 值為–2.03,FDR q 值為 0,NOM q 值為 0
2.4 基因表達之間的相關性及 GSEA 分析
通過 STRING 構建核心基因的 PPI 網絡(圖1c),進一步分析核心基因間的相關性,結果顯示,AURKB、CCNB1 和 MAD2L1 兩兩在 HCC 組織中的表達均具有明顯的正相關性(樣本量=369,P<0.001),見圖3k–3m,因此本研究只分析了該 3 個基因的免疫組織化學結果。本研究通過 The Human Protein Atlas 分析 HCC 組織中 AURKB、CCNB1 和 MAD2L1 的免疫組織化學結果,發現3 個核心基因在 HCC 組織中的表達水平均明顯高于正常肝組織。通過 GSEA 進行分析,本研究發現,AURKB(圖 3n 和3o)、CCNB1 和 MAD2L1 在 G2/M 檢查點(G2_checkpoint)和細胞分裂紡錘體(mitotic spindle)2 個生物學過程明顯富集。
3 討論
近幾十年來,HCC 的死亡率在全球范圍內呈上升趨勢。盡管診斷和治療方法已經取得了許多進步,但是肝癌的預后仍然很差。因此,迫切需要尋找肝癌的特異性和敏感生物標志物及治療靶點。生物信息學結合高通量測序可以系統地對疾病相關基因進行全面分析,是研究疾病發病機制的重要手段。
本研究就肝癌 GSE101728 微陣列表達譜分析數據集中的 7 例 HCC 組織樣本和 7 例癌旁組織樣本,總共獲得 1 082 個 DEGs,涉及 354 個上調基因和 728 個下調基因。為了系統地探索這些 DEGs,本研究對這些 DEGs 進行了 PPI 網絡分析后獲取 10 個網絡的核心節點基因(核心基因),并進行 GO 功能和 KEGG 通路分析。之后,本研究通過 GEPIA 數據庫對 10 個核心基因進行驗證,發現 10 個核心基因在肝癌組織中的表達水平均明顯高于正常的肝組織,提示 10 個核心基因具有肝癌病理診斷的臨床價值;進一步分析 10 個核心基因與肝癌患者預后的相關性,經 log-rank 分析發現,除 CCNB2 外,其余 9 個核心基因高表達患者的 OS 情況明顯差于低表達的患者,且 10 個核心基因高表達患者的 DFS 情況明顯差于低表達的患者,進一步提示了 10 個核心基因的表達有助于肝癌患者的預后評估。由此筆者推測,CDK1、CCNB1、CCNA2、PLK1、AURKB、CDC20、CENPA、CCNB2、MAD2L1 和 KIF2C 可能是肝癌潛在的治療靶點及預后標志物。在細胞分裂中,基因組通過自身復制的方式將遺傳物質傳給每個子代細胞,使每個子代細胞攜帶母代基因組信息。該過程由多種機制控制以確保正確的細胞分裂[8]。各種細胞周期蛋白的異常激活導致不受機體控制的增殖是惡性腫瘤的特性之一[9-10]。因此,深入研究細胞分裂相關基因在肝癌發生發展中的具體機制,對肝癌的治療具有廣闊的前景。
CDK1,也稱為 CDC2,是一種絲氨酸/蘇氨酸激酶,主要參與細胞周期和 RNA 轉錄。有研究[11]表明,CDK1 在肝癌組織中過度表達,下調其的表達可將肝癌細胞阻滯在 G2/M 階段。另有報道[12],二甲雙胍促進 miR-378 的表達后,通過靶向抑制 CDK1 的表達進而抑制 HCC 細胞的增殖。此外,還有研究[13]報道,在臨床Ⅰ期研究中,CDK1 的抑制劑 Terameprocol 對白血病晚期患者的預后具有一定的改善作用。
B 型細胞周期蛋白家族包括 CCNB1 和 CCNB2,這兩種蛋白質的 N 末端區域在結構上有所不同,相似度為 57%[14]。CCNB1 和 CCNB2 共表達在大多數分裂的細胞中,并與 CDK1 一起調節細胞 G2/M 階段。在肺癌細胞中,CCNB2 過表達通過改變紡錘體檢查點導致染色體不穩定。CCNB1 參與細胞周期調控,它在各種癌癥類型中均明顯過表達[15]。另有研究[16-17]表明,CCNB1 促進細胞增殖、腫瘤生長和癌癥復發,并與癌癥的進展和生存有關。CCNA2 與 CDK1 形成二聚體,參與調節 S 期進程和 G2/M 的過渡[18]。
PLK 是一組高度保守的絲氨酸/蘇氨酸激酶,PLK1 是該家族成員之一,主要參與有絲分裂和細胞周期進程,調節紡錘體組裝和染色體分離,促進 DNA 復制,并參與胞質分裂和減數分裂,PLK1 對于精確調節細胞分裂并維持有絲分裂、紡錘體裝配和 DNA 損傷反應中的基因組穩定性至關重要[19-20]。Weiss 等[21]通過臨床試驗發現,PLK1 特異性抑制劑 NMS-1286937通過抑制有絲分裂,對晚期實體腫瘤具有一定的療效。
AURKB 也是一種絲氨酸/蘇氨酸激酶,是有絲分裂過程的關鍵調節酶之一。極光激酶(AURK)家族由 AURKA、AURKB 和 AURKC 組成[22]。據報道,AURKB 在肝癌組織中高表達[23]。AURKB 的高表達與腫瘤侵襲和轉移有關,且與癌癥患者的預后不良有關[24]。在臨床試驗研究中,AURKB 激酶的選擇性抑制劑 Barasertib 在多種晚期實體瘤中具有抗腫瘤特性[25]。
CDC20 作為紡錘體裝配檢查點和細胞周期后期促進復合物(APC/C)的活化劑,能夠調控細胞周期。APC/CDC20 在細胞中期到后期的過渡過程中還通過調節各種關鍵的細胞周期調節因子而發揮關鍵作用[26]。除了調節細胞周期外,還有證據[27]表明,CDC20 在人類腫瘤發生和癌癥進展中起著重要作用。CDC20 的異常表達使 APC/C 異常活化并促進不成熟的細胞周期后期的形成,這將導致兩個子細胞中的有絲分裂異常和非整倍體形成[26]。
研究[28]表明,MAD2L1 在 HCC 組織中的表達明顯較高,并且與預后不良有關,且 miR-200c-5p 通過下調 MAD2L1 抑制 HCC 細胞的增殖、遷移和侵襲。KIF2C 是一種與有絲分裂著絲粒相關的驅動蛋白,在雙極紡錘體的組裝中起重要作用[29]。Chen 等[30]發現,KIF2C 與肝癌組織病理分級和 TNM 分期之間具有明顯相關性,進一步的生存分析發現,其與 HCC 患者的 OS 和 DFS 顯著相關。CENPA 是類著絲粒相關蛋白,作為組蛋白 H3 的變體,在 G1/S 期中參與著絲粒組裝[31]。Takada 等[32]發現,CENPA 受細胞周期蛋白 E1/CDK2 調控,并通過影響染色體的不穩定性而導致腫瘤發生。
由此,筆者發現,CDK1、CCNB1、CCNA2、PLK1、AURKB、CDC20、CENPA、MAD2L1、CCNB2 和 KIF2C 在細胞分裂中起重要的調節作用。目前,根據近些年文獻報道,可以發現本研究篩選的 10 個基因確實與細胞周期密切相關。本研究進行的 GO 和 KEGG 分析發現的一些結果,目前研究比較少,比如 CCNB1、CDK1 和 CCNB2 參與 p53 信號通路的調節;CCNB1、CCNB2 和 PLK1 參與 FoxO 信號通路;CDK1、CDC20 和 CCNA2 參與病毒的致癌作用,AURKB、CCNB1 和 MAD2L1 基因間具有較強的相關性等,需進一步驗證。
本研究通過生物信息學的方法初步分析其在肝癌組織中的表達并探討了其在肝癌發生發展中的潛在機制,下一步筆者團隊將設計相關實驗進一步研究相關信號通路,探討 AURKB、CCNB1 和 MAD2L1 之間是否具有調控關系等。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:黃康負責研究設計、數據處理及論文撰寫,彭貴主負責論文的審查及修改。