引用本文: 常彥祥, 金磊, 白雄雄, 劉昊, 徐碩男. 著絲粒蛋白F表達對非小細胞肺癌生物學行為的影響和預后判斷. 中國胸心血管外科臨床雜志, 2022, 29(6): 711-716. doi: 10.7507/1007-4848.202012011 復制
肺癌是惡性腫瘤最常見的類型之一[1]。特別在中國,肺癌的發病率和死亡率都位居第一,其中非小細胞肺癌(non-small cell lung cancer,NSCLC)約占 80%~85%,是肺癌最重要的病理亞型[2-3],主要包括鱗狀細胞癌及腺癌。由于其復雜的生物學特性,在臨床上肺癌早期診斷困難、進展快、易轉移及復發、預后不理想,NSCLC 患者術后復發率高達 40%[4]。如何發掘潛在的生物標志物,明確其表達水平與腫瘤的關系,并進一步從分子層面揭示腫瘤的發病機制,對靶向治療及術前、術后輔助治療有非常重要的指導意義。著絲粒蛋白 F(centromere protein F,CENPF)也被稱為 mitosin/P330d,是一種核磷酸,大小約 367 kDa,在 1993 年由 Rattner 等[5]發現。在目前各類報道中,已發現 CENPF 與許多類型的惡性腫瘤有關,如鼻咽癌、乳腺癌及胃腸道間質瘤等[6-8],最新的研究[9]也證實 CENPF 表達水平與 NSCLC 患者預后相關。然而,在 NSCLC 中與 CENPF 表達水平相關聯的靶點基因和表達通路迄今尚未確定。近年伴隨著高通量測序和生物信息學的迅速發展,腫瘤相關的數據庫成為挖掘腫瘤相關基因的可靠的大數據[10-11]。在本研究中,我們深度分析生物信息學數據庫中數據,通過系統檢索 Oncomine 數據庫、人類蛋白質圖譜(human protein atlas,HPA)、Kaplan-Meier Plotter、STRING 和 DAVID 等多個類型數據庫從基因、蛋白、免疫組織化學染色(immunohistonchemistry,IHC)、表達通路及生存結局等多個方面理解肺癌的生物進程,澄清 CENPF 可能是 NSCLC 的潛在生物標志物,并嘗試討論腫瘤微環境下 CENPF 調控機制。
1 資料與方法
1.1 數據庫檢索
檢索時限為建庫到2020年10月1日,包含CENPF基因及相關蛋白、IHC、表達通路及生存結局的在線腫瘤學數據庫。排除標準:(1)變量未納入肺癌患者;(2)數據缺失;(3)關聯基因生物學意義低。由2名研究員單獨檢索數據庫、提取資料,由第3名研究員給予驗證。
1.1.1 Oncomine 數據庫
Oncomine 數據庫(
1.1.2 人類蛋白質圖譜
HPA 數據庫(
1.1.3 Kaplan-Meier Plotter
Kaplan-Meier Plotter 數據庫(
1.1.4 STRING 數據庫
STRING 數據庫(
1.1.5 DAVID 數據庫
DAVID 數據庫(the Database for Annotation,Visualization and Integrated Discovery)(
1.2 統計學分析
采用 SPSS 22.0 軟件對獲取的數據進行統計學分析,正常肺組織和肺癌組織間差異性比較采用 t 檢驗,生存分析用 Kaplan-Meier 和 Log-rank 檢驗,雙側P≤0.05 為差異有統計學意義。
2 結果
2.1 著絲粒蛋白 F 在不同腫瘤中的表達情況
通過對 Oncomine 數據庫進行檢索分析,涉及 CENPF 在正常組織和癌組織表達的對比研究共 454 項,包括 17 種癌癥,共有 76 項研究差異有統計學意義,其中 69 項研究中 CENPF 表現為高表達,7 項表現為低表達。進一步觀察在肺癌中共計有 13 項均為高表達;見圖 1。

2.2 免疫組織化學染色
從 HPA 中提取了 CENPF 在正常肺組織和肺癌組織中特征化的IHC圖像。正常肺組織中 CENPF 不表達,而 70%~75% 肺腺癌病變組織中 CENPF 蛋白質染色定位于細胞核,呈強陽性;見圖 2。

a:正常組織;b:肺腺癌組織
2.3 生存分析
對 Kaplan -Meier Plotter 數據庫中所有可知 CENPF 基因表達的肺癌患者的生存期進行分析,將患者分為高表達組和低表達組,CENPF 低表達組中位 OS 顯著長于高表達組(93 個月 vs. 48 個月,P<0.001)。進一步進行亞組分析,鱗狀細胞癌患者 CENPF 低表達和高表達組之間 OS 差異無統計學意義(60 個月 vs. 53 個月,P=0.560),而腺癌患者CENPF低表達組中位 OS 明顯長于高表達組(110 個月 vs. 90 個月,P=0.022),在 PFS 上也得到了驗證(43 個月 vs. 21 個月,P=0.001);見圖 3。

a:肺癌總生存期;b:肺鱗狀細胞癌總生存期;c:肺腺癌無疾病進展生存期;d:肺腺癌總生存期
2.4 基因富集和通路功能注釋
通過 STRING 數據庫進一步查找與 CENPF 相關的 50 個基因,Cytoscape 軟件生成網絡互作圖;見圖 4。利用 DAVID 數據庫評估包括目的基因和關聯基因在內 51 個基因的 GO 富集和 KEGG 功能注釋,結果顯示這些基因在生物過程中主要影響泛素連接酶 K11 修飾蛋白,在細胞成分中主要影響后期促進復合物(anaphase-promoting complex,APC),在分子功能中主要影響 ATP 結合,在 KEGG 通路功能注釋主要影響細胞周期;見圖 5。


a:生物過程(BP);b:細胞成分(CC);c:分子功能(MF);d:KEGG 通路
3 討論
NSCLC 是肺癌的主要病理類型,在臨床實踐中,最常用的治療手段包括手術切除、放射治療、化學治療、靶向治療以及免疫治療[12-13]。盡管這些治療方法近年來取得了進步,預后仍然不理想[14]。預后不良的主要原因是約 3/4 患者在首診時已經處于晚期,5 年生存率僅為 19%[15]。此外,分子靶向藥物可在一定程度上提高存活率,但突變群體量有限,且經靶向治療后 8~13 個月會出現耐藥現象,影響后續抗腫瘤治療[16]。
CENPF 在多種惡性腫瘤中均證實存在高表達,與預后有重要的聯系[17]。2018 年我國學者通過對 Oncomine 及 GEO 數據庫中乳腺癌研究數據進行統計分析后,得出乳腺癌患者中癌變組織的 CENPF 蛋白表達率達到 70%,而正常組織中表達率為 33.3%,CENPF mRNA 高表達的患者 RFS 和 OS 較差相關,且發生骨轉移的幾率也高[18]。在本研究中,我們首先調查了 CENPF 在 NSCLC 中的表達,Kaplan-Meier Plotter 的分析結果顯示,CENPF 表達水平與腺癌的生存期有關。在前列腺癌中 CENPF 也有相似的研究成果。Aytes 等[19]設計一個基于體內微擾的小鼠腫瘤模型的調控網絡,并與人類前列腺癌數據集生成的互補調控網絡進行了對比分析。通過對這些配對對照和實驗驗證,闡明了 CENPF 作為前列腺癌的驅動因素,可以促進腫瘤生長,成為預后不良的指標。Shahid 等[20]對 PC3 細胞中 CENPF 基因進行敲除,細胞內生物能量容量、乙酰輔酶 a 生成、組蛋白乙酰化和脂質代謝整體降低,這表明 CENPF 可能通過其在線粒體中的作用而成為前列腺癌細胞代謝的重要調節因子。
在關于肝細胞癌的研究中,研究人員發現 CENPF 在肝細胞癌的生長和浸潤過程中發揮重要的作用,通過對公共數據庫進行檢索并利用流式細胞儀進行實驗驗證,得出 CENPF 起到癌癥-驅動因子的作用[21-22]。這些機制也可能存在于 NSCLC,尤其是腺癌中。
CENPF 的表達嚴格遵循細胞周期性,在有絲分裂 G0、G1 期中幾乎檢測不到,S 期僅低水平表達,隨后表達增高逐漸聚積,在 G2 至 M 期到達峰值,在有絲分裂末期通過泛素-蛋白酶體系介導水解迅速消減[23]。國外學者[24]也證實,CENPF 與細胞分裂及分化功能相關,對維持動粒-微管的穩定性非常重要,能夠調控細胞有絲分裂、加速細胞周期。我們在本次研究中發現,肺腺癌組織中 CENPF 蛋白為過表達,且對 CENPF 及其關聯基因進行 GO 功能及 KEGG 通路分析后,明確 CENPF 及關聯基因能夠影響肺癌細胞周期,與 APC 活性受抑制導致有絲分裂減少,泛素連接酶 K11 功能異常等相關,這與惡性腫瘤具有增殖及侵襲能力強的特點相符合。
總之,本研究表明CENPF 的蛋白表達水平在肺腺癌中顯著上調,具有早期診斷和預后評估的臨床價值。CENPF 通過改變 APC 及泛素連接酶活性影響肺癌細胞增殖周期,提示 CENPF 基因可能成為肺癌分子靶向治療的潛在靶點。
利益沖突:無。
作者貢獻:常彥祥負責數據分析和論文撰寫;徐碩男負責論文設計和論文審閱;金磊、劉昊、白雄雄負責生物信息數據收集和文獻回顧。
肺癌是惡性腫瘤最常見的類型之一[1]。特別在中國,肺癌的發病率和死亡率都位居第一,其中非小細胞肺癌(non-small cell lung cancer,NSCLC)約占 80%~85%,是肺癌最重要的病理亞型[2-3],主要包括鱗狀細胞癌及腺癌。由于其復雜的生物學特性,在臨床上肺癌早期診斷困難、進展快、易轉移及復發、預后不理想,NSCLC 患者術后復發率高達 40%[4]。如何發掘潛在的生物標志物,明確其表達水平與腫瘤的關系,并進一步從分子層面揭示腫瘤的發病機制,對靶向治療及術前、術后輔助治療有非常重要的指導意義。著絲粒蛋白 F(centromere protein F,CENPF)也被稱為 mitosin/P330d,是一種核磷酸,大小約 367 kDa,在 1993 年由 Rattner 等[5]發現。在目前各類報道中,已發現 CENPF 與許多類型的惡性腫瘤有關,如鼻咽癌、乳腺癌及胃腸道間質瘤等[6-8],最新的研究[9]也證實 CENPF 表達水平與 NSCLC 患者預后相關。然而,在 NSCLC 中與 CENPF 表達水平相關聯的靶點基因和表達通路迄今尚未確定。近年伴隨著高通量測序和生物信息學的迅速發展,腫瘤相關的數據庫成為挖掘腫瘤相關基因的可靠的大數據[10-11]。在本研究中,我們深度分析生物信息學數據庫中數據,通過系統檢索 Oncomine 數據庫、人類蛋白質圖譜(human protein atlas,HPA)、Kaplan-Meier Plotter、STRING 和 DAVID 等多個類型數據庫從基因、蛋白、免疫組織化學染色(immunohistonchemistry,IHC)、表達通路及生存結局等多個方面理解肺癌的生物進程,澄清 CENPF 可能是 NSCLC 的潛在生物標志物,并嘗試討論腫瘤微環境下 CENPF 調控機制。
1 資料與方法
1.1 數據庫檢索
檢索時限為建庫到2020年10月1日,包含CENPF基因及相關蛋白、IHC、表達通路及生存結局的在線腫瘤學數據庫。排除標準:(1)變量未納入肺癌患者;(2)數據缺失;(3)關聯基因生物學意義低。由2名研究員單獨檢索數據庫、提取資料,由第3名研究員給予驗證。
1.1.1 Oncomine 數據庫
Oncomine 數據庫(
1.1.2 人類蛋白質圖譜
HPA 數據庫(
1.1.3 Kaplan-Meier Plotter
Kaplan-Meier Plotter 數據庫(
1.1.4 STRING 數據庫
STRING 數據庫(
1.1.5 DAVID 數據庫
DAVID 數據庫(the Database for Annotation,Visualization and Integrated Discovery)(
1.2 統計學分析
采用 SPSS 22.0 軟件對獲取的數據進行統計學分析,正常肺組織和肺癌組織間差異性比較采用 t 檢驗,生存分析用 Kaplan-Meier 和 Log-rank 檢驗,雙側P≤0.05 為差異有統計學意義。
2 結果
2.1 著絲粒蛋白 F 在不同腫瘤中的表達情況
通過對 Oncomine 數據庫進行檢索分析,涉及 CENPF 在正常組織和癌組織表達的對比研究共 454 項,包括 17 種癌癥,共有 76 項研究差異有統計學意義,其中 69 項研究中 CENPF 表現為高表達,7 項表現為低表達。進一步觀察在肺癌中共計有 13 項均為高表達;見圖 1。

2.2 免疫組織化學染色
從 HPA 中提取了 CENPF 在正常肺組織和肺癌組織中特征化的IHC圖像。正常肺組織中 CENPF 不表達,而 70%~75% 肺腺癌病變組織中 CENPF 蛋白質染色定位于細胞核,呈強陽性;見圖 2。

a:正常組織;b:肺腺癌組織
2.3 生存分析
對 Kaplan -Meier Plotter 數據庫中所有可知 CENPF 基因表達的肺癌患者的生存期進行分析,將患者分為高表達組和低表達組,CENPF 低表達組中位 OS 顯著長于高表達組(93 個月 vs. 48 個月,P<0.001)。進一步進行亞組分析,鱗狀細胞癌患者 CENPF 低表達和高表達組之間 OS 差異無統計學意義(60 個月 vs. 53 個月,P=0.560),而腺癌患者CENPF低表達組中位 OS 明顯長于高表達組(110 個月 vs. 90 個月,P=0.022),在 PFS 上也得到了驗證(43 個月 vs. 21 個月,P=0.001);見圖 3。

a:肺癌總生存期;b:肺鱗狀細胞癌總生存期;c:肺腺癌無疾病進展生存期;d:肺腺癌總生存期
2.4 基因富集和通路功能注釋
通過 STRING 數據庫進一步查找與 CENPF 相關的 50 個基因,Cytoscape 軟件生成網絡互作圖;見圖 4。利用 DAVID 數據庫評估包括目的基因和關聯基因在內 51 個基因的 GO 富集和 KEGG 功能注釋,結果顯示這些基因在生物過程中主要影響泛素連接酶 K11 修飾蛋白,在細胞成分中主要影響后期促進復合物(anaphase-promoting complex,APC),在分子功能中主要影響 ATP 結合,在 KEGG 通路功能注釋主要影響細胞周期;見圖 5。


a:生物過程(BP);b:細胞成分(CC);c:分子功能(MF);d:KEGG 通路
3 討論
NSCLC 是肺癌的主要病理類型,在臨床實踐中,最常用的治療手段包括手術切除、放射治療、化學治療、靶向治療以及免疫治療[12-13]。盡管這些治療方法近年來取得了進步,預后仍然不理想[14]。預后不良的主要原因是約 3/4 患者在首診時已經處于晚期,5 年生存率僅為 19%[15]。此外,分子靶向藥物可在一定程度上提高存活率,但突變群體量有限,且經靶向治療后 8~13 個月會出現耐藥現象,影響后續抗腫瘤治療[16]。
CENPF 在多種惡性腫瘤中均證實存在高表達,與預后有重要的聯系[17]。2018 年我國學者通過對 Oncomine 及 GEO 數據庫中乳腺癌研究數據進行統計分析后,得出乳腺癌患者中癌變組織的 CENPF 蛋白表達率達到 70%,而正常組織中表達率為 33.3%,CENPF mRNA 高表達的患者 RFS 和 OS 較差相關,且發生骨轉移的幾率也高[18]。在本研究中,我們首先調查了 CENPF 在 NSCLC 中的表達,Kaplan-Meier Plotter 的分析結果顯示,CENPF 表達水平與腺癌的生存期有關。在前列腺癌中 CENPF 也有相似的研究成果。Aytes 等[19]設計一個基于體內微擾的小鼠腫瘤模型的調控網絡,并與人類前列腺癌數據集生成的互補調控網絡進行了對比分析。通過對這些配對對照和實驗驗證,闡明了 CENPF 作為前列腺癌的驅動因素,可以促進腫瘤生長,成為預后不良的指標。Shahid 等[20]對 PC3 細胞中 CENPF 基因進行敲除,細胞內生物能量容量、乙酰輔酶 a 生成、組蛋白乙酰化和脂質代謝整體降低,這表明 CENPF 可能通過其在線粒體中的作用而成為前列腺癌細胞代謝的重要調節因子。
在關于肝細胞癌的研究中,研究人員發現 CENPF 在肝細胞癌的生長和浸潤過程中發揮重要的作用,通過對公共數據庫進行檢索并利用流式細胞儀進行實驗驗證,得出 CENPF 起到癌癥-驅動因子的作用[21-22]。這些機制也可能存在于 NSCLC,尤其是腺癌中。
CENPF 的表達嚴格遵循細胞周期性,在有絲分裂 G0、G1 期中幾乎檢測不到,S 期僅低水平表達,隨后表達增高逐漸聚積,在 G2 至 M 期到達峰值,在有絲分裂末期通過泛素-蛋白酶體系介導水解迅速消減[23]。國外學者[24]也證實,CENPF 與細胞分裂及分化功能相關,對維持動粒-微管的穩定性非常重要,能夠調控細胞有絲分裂、加速細胞周期。我們在本次研究中發現,肺腺癌組織中 CENPF 蛋白為過表達,且對 CENPF 及其關聯基因進行 GO 功能及 KEGG 通路分析后,明確 CENPF 及關聯基因能夠影響肺癌細胞周期,與 APC 活性受抑制導致有絲分裂減少,泛素連接酶 K11 功能異常等相關,這與惡性腫瘤具有增殖及侵襲能力強的特點相符合。
總之,本研究表明CENPF 的蛋白表達水平在肺腺癌中顯著上調,具有早期診斷和預后評估的臨床價值。CENPF 通過改變 APC 及泛素連接酶活性影響肺癌細胞增殖周期,提示 CENPF 基因可能成為肺癌分子靶向治療的潛在靶點。
利益沖突:無。
作者貢獻:常彥祥負責數據分析和論文撰寫;徐碩男負責論文設計和論文審閱;金磊、劉昊、白雄雄負責生物信息數據收集和文獻回顧。