引用本文: 肖翠, 楊建寶, 王成, 孫移明, 李璇, 李政, 劉炎斌, 安海鳴. 基于生物信息學分析冷誘導 RNA 結合蛋白在肺腺癌組織中的表達及臨床意義. 中國胸心血管外科臨床雜志, 2022, 29(7): 914-922. doi: 10.7507/1007-4848.202102065 復制
肺癌是目前全球死亡率最高的惡性腫瘤,國際癌癥研究機構在 2018 年發布的統計數據顯示,全球約有 2 093 876 例(11.6%)新發肺癌患者,且約有 1 761 007 例(18.4%)死于該疾病[1]。非小細胞肺癌占確診肺癌的 80% 以上,其中肺腺癌(lung adenocarcinoma,LUAD)又是最常見的病理類型之一,其發病率及死亡率呈逐漸上升趨勢[2]。肺癌起病隱匿,早期缺乏典型臨床表現。雖然目前肺癌的診斷技術及治療方式在不斷改善,但患者的 5 年生存率仍低于 18%[1, 3]。此外,LUAD 的發病機制是一個復雜的過程,涉及基因突變的逐步積累,這些基因突變涉及各種分子和細胞事件,包括自噬、內質網應激、氧化應激和細胞周期異常等[4-8]。這表明,尋找新的治療靶點已成為對抗肺癌的一個日益嚴峻的挑戰。
冷誘導 RNA 結合蛋白(cold-inducible RNA-binding protein,CIRBP)在 1997 年被 Hiroyuki Nishiyama 等首先報道,其是由氨基端 RNA 結合結構域(RMM 模體)和羧基端富含甘氨酸結構域(RGG 模體)組成的 18-kD 蛋白。CIRBP 在結構上由 172 個氨基酸組成,屬于高度保守的 RNA 結合蛋白家族成員[9-10]。CIRBP 廣泛存在于機體的各組織和器官中,參與細胞增殖、分化、凋亡及生物節律調節等眾多過程。當細胞經受低溫、低氧、紫外線照射及滲透壓改變等刺激時,CIRBP 會上調,而在輕度高溫等刺激時,則相反[11-12]。目前研究[13-15]發現,在腫瘤的發生發展中 CIRBP 也起著重要作用,但其在不同腫瘤組織中的表達呈現多樣性。在肝癌、膀胱癌、乳腺癌等中 CIRBP 高表達,且其表達水平與患者生存預后呈負相關;而在子宮內膜癌、腎癌中其表達量顯著下降,與預后呈正相關[16-17]。然而,目前 CIRBP 在 LUAD 中的表達及臨床意義罕見報道,因此本研究通過生物信息學方法分析其在 LUAD 中的表達及意義,為以后的研究提供新的方向和科學依據。
1 資料與方法
1.1 數據來源和整理
本研究通過從 Gene Expression Omnibus(GEO)數據庫(
在 The Cancer Genome Atlas(TCGA)數據庫(
1.2 CIRBP 基因在 TCGA-LUAD 數據庫中的表達
使用 R(v4.0.2)軟件讀取整理好的 TCGA-LUAD 數據庫中基因表達數據,應用“limma”包和“beeswarm”包統計分析 CIRBP 在 LUAD 組織和癌旁組織差異表達情況,繪制出 CIRBP 表達散點差異圖和配對表達差異圖。
1.3 臨床病理特征相關性分析
使用 R(v4.0.2)軟件分別讀取 TCGA-LUAD 和 GEO-LUAD 基因表達數據及臨床資料數據,應用 Kruskal-Wallis H 檢驗分析方法分別對 LUAD 患者 T 分期和 N 分期進行分析,以了解 CIRBP 表達分別與 T 分期和 N 分期的關系。
1.4 生存曲線分析及總生存期相關 Cox 回歸分析
使用 R(v4.0.2)軟件分別讀取 TCGA-LUAD 和 GEO-LUAD 基因表達數據及臨床資料數據,應用“survival”程序包,將樣本中 CIRBP 相關 miRNA 表達的中位數作為分界點,將患者分為高低表達兩組,分析 LUAD 中 CIRBP 基因高表達組和低表達組的生存情況。與此同時,基于 GEO-LUAD 基因表達數據及臨床資料數據,應用“survival”及“survminer”程序包對 CIRBP 表達量、年齡、性別、T 分期、N 分期與總生存期進行相關性的單因素和多因素 Cox 回歸分析,并繪制森林圖。其中性別、T 分期及 N 分期以分類變量的形式進行 Cox 回歸分析,分別以女性、T1 和 N1 作為參照。
1.5 GO分析及KEGG分析
用樣本中 CIRBP 相關 miRNA 表達中位數將樣本分為高低表達兩組,設定 |logFc(高表達組基因表達量/低表達組中基因表達量)|≥0.5,adj.P≤0.05,應用“limma”包獲取差異基因。使用 R(v4.0.2)軟件讀取差異基因文件,設定 Q≤0.05,應用“BiocManager”、“clusterProfiler”、“DOSE”及“enrichplot”程序包分別進行 GO 富集分析和 KEGG 富集分析,結果輸出為氣泡圖。
1.6 構建蛋白互作網絡
將 CIRBP 相關核心差異基因導入 STRING(
1.7 統計學分析
數據匯總整理后,采用 R(v4.0.2)軟件以及 SPSS Statistics 25.0 軟件進行分析。使用 Mann-Whitney U 檢驗分析基因在 LUAD 組織和癌旁組織中的表達差異。Kaplan-Meierr 法分析基因表達與 LUAD 患者生存的關系。T 分期、N 分期采用 Kruskal-Wallis H 檢驗進行分析。單因素和多因素 Cox 回歸模型用于分析 CIRBP 在 LUAD 患者中的預后意義。P≤0.05 為差異具有統計學意義。
2 結果
2.1 LUAD 組織與癌旁組織中 CIRBP 的表達差異
對 TCGA-LUAD 數據中非配對 LUAD 及癌旁樣本應用 R(v4.0.2)軟件采用 Mann-Whitney U 檢驗進行分析,結果表明 CIRBP 基因在 LUAD 組織中的表達水平較癌旁組織顯著下降(P<0.01,圖 1a)。進一步對 TCGA-LUAD 數據庫中 57 例同時包含癌組織及癌旁組織的樣本進行檢驗,結果顯示 LUAD 組織樣本中 CIRBP 基因表達量仍顯著低于癌旁組織(P<0.01,圖 1b)。

a:TCGA-LUAD 數據庫中 CIRBP 在肺腺癌組織(535 例)和癌旁肺組織(59 例)中的表達比較;b:57 例配對的肺腺癌組織和癌旁組織中 CIRBP 表達比較
2.2 CIRBP 基因表達與 LUAD 患者臨床病理特征相關性分析
分別對 TCGA-LUAD 和 GEO-LUAD 數據中 LUAD 患者 T 分期及 N 分期進行分析后,發現兩數據庫中 LUAD CIRBP 基因的表達水平均與 LUAD 患者的 T 分期(圖 2a~b)、N 分期(圖 2c~d)相關,且隨著分期的增高 CIRBP 基因的表達水平有下降趨勢。

a:TCGA-LUAD 數據中 T 分期分析(T1 期 172 例,T2 期 281 例,T3 期 47 例,T4 期 19 例);b:GEO-LUAD 數據中 T 分期分析(T1期 149 例,T2 期 251 例,T3 期 28 例,T4 期 11 例);c:TCGA-LUAD 數據中 N 分期分析(N0 期 335 例,N1 期 98 例,N2 期 75 例,N3 期 2 例);d:GEO-LUAD 數據中 N 分期分析(N0 期 299 例,N1 期 87 例,N2 期 53 例)
2.3 CIRBP 表達水平與 LUAD 患者預后的關系
使用 Kaplan-Meier 法分析 TCGA-LUAD 數據中 LUAD CIRBP 基因高低表達兩組總體生存率的差異,結果發現,高表達 CIRBP 患者的總體生存率顯著高于低表達組,說明 CIRBP 表達水平與 LUAD 患者預后相關(P=0.004,圖 3a)。同時對 GEO-LUAD 數據庫中 LUAD 樣本再次驗證,得出同樣的分析結果,CIRBP 表達水平與 LUAD 患者預后呈正相關(P<0.001,圖 3b)。并對 GEO-LUAD 數據進行單因素及多因素 Cox 回歸分析(表 1,圖 4),結果說明,CIRBP 可以作為 LUAD 患者的獨立預后因素。


a:TCGA-LUAD 數據庫中,CIRBP 表達水平與肺腺癌患者總體生存率的生存曲線圖;b:GEO-LUAD 數據庫中,CIRBP 表達水平與肺腺癌患者總體生存率的生存曲線圖

2.4 GO 和 KEGG 富集分析
為了解 CIRBP 在 LUAD 中與其相關核心基因的功能,包括分子功能、細胞組成及生物學過程,因此我們在基因本體中進行 GO 功能注釋。結果顯示其富集的生物學功能主要表現在細胞器裂變、核分裂、有絲分裂核分裂、染色體分離、核染色體分離、姐妹染色單體分離及 DNA 復制等(圖 5)。同時,為進一步了解 CIRBP 在 LUAD 中參與的相關信號通路,我們對其進行了 KEGG 通路富集分析。通過分析發現 CIRBP 與相關核心基因主要參與了細胞周期、谷胱甘肽代謝、DNA 復制、補體和凝血級聯、類風濕性關節炎、人類 T 細胞白血病病毒 1 感染及白細胞介素 17信號通路等的調節(圖 6)。


2.5 蛋白互作網絡
為了更好地了解 CIRBP 在 LUAD 中的相互作用關系,因此我們將 CIRBP 及篩選的 79 個核心差異基因導入 STRING 數據庫構建 CIRBP 的蛋白互作網絡,結果顯示 CIRBP 與細胞周期蛋白 B2(cyclin B2,CCNB2)具有相互聯系(圖 7)。為進一步了解兩者之間的關系,通過 GEPIA 在線分析發現 CIRBP 基因與 CCNB2 基因的表達呈負相關(P<0.001,R=–0.36,圖 8)。


3 討論
既往研究[18]表明,CIRBP 不僅可作為炎癥介質參與炎癥過程,還與腫瘤的發生和發展密切相關。Brochu 等[19]發現 CIRBP 可能通過激活核轉錄因子κB(nuclear factor κB,NF-κB)途徑刺激促炎細胞因子的釋放。Chen 等[20]通過一項肺冷應激模型研究驗證了 CIRBP 可通過 TLR4/NF-κB 途徑介導組織損傷、炎癥發生和黏液分泌增加。但 CIRBP 也被證實可以減輕炎癥反應,一項傷口愈合的研究[21]表明,在 CIRBP 基因敲除小鼠中,腫瘤壞死因子-α 的表達增加了 65 倍,而在野生型小鼠中只增加了 16 倍,這表明 CIRBP 可以減輕創傷相關的炎癥。在腫瘤的發生發展中,CIRBP 也扮演著不同的角色,其可促癌也可抑癌。在促癌方面,Guo 等[15]發現 CIRBP 在多個乳腺癌細胞系中過表達,其過表達與細胞周期蛋白 E1(cyclin E1)上調、促進增殖、減少凋亡有關。Gao 等[22]證實cyclin E1正向調節細胞周期,是乳腺癌預后不良的標志。另外,Indacochea等[23]發現 CIRBP 轉錄水平與乳腺癌常見的 luminal A/B 型患者的不良預后相關,這可能是 CIRBP 下調半胱氨酸蛋白酶抑制劑 C的 mRNA 水平,促進了乳腺癌細胞的致癌作用。近期,Dankner 等[24]對 164 例腦轉移瘤患者的骨髓和轉移瘤鄰近腦組織進行單細胞 RNA 測序,通過分析發現,與在轉移區域內的腫瘤細胞相比,在侵襲性腫瘤細胞中 CIRBP 過表達,并通過異種移植物模型實驗驗證,說明了CIRBP的過表達是腫瘤細胞在大腦中侵襲所必須的,驅動了腫瘤手術切除后患者腦轉移的復發。這都說明了 CIRBP 在腫瘤的發生發展中扮演著重要的促癌角色。在抑癌方面,Hamid 等[16]發現 CIRBP 在正常子宮內膜中的表達始終最高,在子宮內膜增生癥中的表達變化不明顯,而在癌中的表達顯著降低且與預后相關。同時研究表明在月經周期中,正常子宮內膜中 CIRBP 的表達與增殖標記物 Ki-67 呈負相關,這與其抑制增殖的作用是一致的。另外,一項基于生物信息學分析并實驗驗證的研究[17]表明,CIRBP 基因過表達后,腎癌細胞中遷移相關蛋白 N-cadherin 表達明顯降低,E-cadherin 水平明顯增高,而 AKT 通路關鍵蛋白 p-AKT 和 p-GSK3β 的表達水平明顯下調,且與腎癌患者預后呈正相關。然而,CIRBP 基因在 LUAD 的發生發展中扮演的角色尚無相關研究。
本研究首先通過對 TCGA-LUAD 數據庫的挖掘,發現 LUAD 中 CIRBP 基因在 LUAD 組織中較正常肺組織表達顯著下降,同時生存分析曲線表明 CIRBP 基因低表達患者生存期較高表達患者縮短。我們使用 GEO-LUAD 數據庫中數據進行再次驗證,得出了與上述一致的結果。通過單因素及多因素 Cox 分析結果顯示 CIRBP 可以作為 LUAD 患者的獨立預后因素。這提示著 CIRBP 在 LUAD 中可能是一個重要的抑癌基因,參與了 LUAD 的發生發展。我們進一步利用 TCGA-LUAD 及 GEO-LUAD 數據庫中 LUAD 數據,分別分析 CIRBP 基因與 LUAD 患者病理特征之間關系,我們發現 CIRBP 基因表達水平與 LUAD 患者 T 分期、N 分期顯著相關,且兩數據庫結論可相互驗證。但在圖 2b 中 CIRBP 表達在 T4 期低于 T3 期,圖 2c 中其表達 N3 期低于 N2 期,存在這樣的問題可能在于 GEO 及 TCGA 數據庫所納入的 LUAD 處于 T4 期和 N3 期的樣本量少,待樣本量擴充后可再行分析。為進一步了解目的基因在 LUAD 中參與的功能及作用通路,GO 功能注釋結果顯示其富集的生物學功能主要表現在細胞器裂變、核分裂、有絲分裂核分裂、染色體分離及 DNA 復制等,KEGG 分析發現 CIRBP 主要參與細胞周期、谷胱甘肽代謝、DNA 復制等通路。在一項小鼠睪丸熱應激的研究中,Xu 等[25]發現 CIRBP 可能在轉錄水平上調節 Sam68 的表達和磷酸化 ERK1/2 蛋白的表達,以影響小鼠睪丸和小鼠原代精母細胞的有絲分裂過程,從而防止小鼠受熱應激引起的睪丸損傷。Masuda 等[26]發現在培養的小鼠胚胎成纖維細胞中,CIRBP 蛋白可以通過與 Dyrk1b/Mirk 的相互作用來調節 p27 和細胞周期蛋白 D1 的磷酸化和穩定,并加速細胞周期從 G0 到 G1 階段以及從 G1 到 S 期的進展。Zhang 等[27]發現 CIRBP 的過表達可以挽救 1% 氧氣對神經干細胞的細胞周期蛋白 D1 表達和細胞周期進展的抑制作用,這表明 CIRBP 可調節神經干細胞增殖過程。但目前暫無 CIRBP 在 LUAD 中作用機制的研究報道。
通過構建蛋白互作網絡我們發現 CIRBP 與CCNB2具有相互聯系,且通過 GEPIA 在線分析發現兩者的表達呈負相關。目前研究發現 CCNB2 是細胞周期蛋白家族成員之一,在 G2/M 轉化過程中起關鍵作用,已被發現在人類腫瘤中表達上調[28]。Wang 等[29]基于生物信息學分析發現 CCNB2 在 LUAD 患者中高表達,可作為 LUAD 患者預后不良的生物標志物。而且通過細胞功能實驗證實沉默 CCNB2 對 LUAD 細胞增殖、遷移和侵襲均有抑制作用,細胞周期阻滯于 G0/G1 期。這可能提示著 CIRBP/CCNB2 軸影響著 LUAD 的發生發展,但目前關于 CIRBP 與 CCNB2 間的相互聯系和作用機制尚無相關文獻報道,這有待實驗進一步證實。
綜上所述,本研究主要通過生物信息學分析了 CIRBP 在 LUAD 中的表達及臨床意義,發現 CIRBP 基因可能會成為 LUAD 臨床預后評估的指標以及靶向治療的新靶點,并且初步探討了 CIRBP 在 LUAD 中可能參與的信號通路。但同時上述結果僅來源于大數據分析,存在明顯的局限性。我們目前正在同步從臨床角度及基礎實驗方面驗證,進一步研究 CIRBP 對 LUAD 細胞的增殖、凋亡、侵襲轉移等方面的影響,并深入探討該基因在 LUAD 中的致病機制,以期為后續研究提供新思路和新依據。
利益沖突:無。
作者貢獻:肖翠負責論文設計、數據整理分析、論文撰寫與修改;楊建寶、王成參與選題,負責論文審閱與修改;孫移明、李璇、李政負責數據處理、論文審閱;劉炎斌、安海鳴負責對文章的知識性內容做批判性審閱。
肺癌是目前全球死亡率最高的惡性腫瘤,國際癌癥研究機構在 2018 年發布的統計數據顯示,全球約有 2 093 876 例(11.6%)新發肺癌患者,且約有 1 761 007 例(18.4%)死于該疾病[1]。非小細胞肺癌占確診肺癌的 80% 以上,其中肺腺癌(lung adenocarcinoma,LUAD)又是最常見的病理類型之一,其發病率及死亡率呈逐漸上升趨勢[2]。肺癌起病隱匿,早期缺乏典型臨床表現。雖然目前肺癌的診斷技術及治療方式在不斷改善,但患者的 5 年生存率仍低于 18%[1, 3]。此外,LUAD 的發病機制是一個復雜的過程,涉及基因突變的逐步積累,這些基因突變涉及各種分子和細胞事件,包括自噬、內質網應激、氧化應激和細胞周期異常等[4-8]。這表明,尋找新的治療靶點已成為對抗肺癌的一個日益嚴峻的挑戰。
冷誘導 RNA 結合蛋白(cold-inducible RNA-binding protein,CIRBP)在 1997 年被 Hiroyuki Nishiyama 等首先報道,其是由氨基端 RNA 結合結構域(RMM 模體)和羧基端富含甘氨酸結構域(RGG 模體)組成的 18-kD 蛋白。CIRBP 在結構上由 172 個氨基酸組成,屬于高度保守的 RNA 結合蛋白家族成員[9-10]。CIRBP 廣泛存在于機體的各組織和器官中,參與細胞增殖、分化、凋亡及生物節律調節等眾多過程。當細胞經受低溫、低氧、紫外線照射及滲透壓改變等刺激時,CIRBP 會上調,而在輕度高溫等刺激時,則相反[11-12]。目前研究[13-15]發現,在腫瘤的發生發展中 CIRBP 也起著重要作用,但其在不同腫瘤組織中的表達呈現多樣性。在肝癌、膀胱癌、乳腺癌等中 CIRBP 高表達,且其表達水平與患者生存預后呈負相關;而在子宮內膜癌、腎癌中其表達量顯著下降,與預后呈正相關[16-17]。然而,目前 CIRBP 在 LUAD 中的表達及臨床意義罕見報道,因此本研究通過生物信息學方法分析其在 LUAD 中的表達及意義,為以后的研究提供新的方向和科學依據。
1 資料與方法
1.1 數據來源和整理
本研究通過從 Gene Expression Omnibus(GEO)數據庫(
在 The Cancer Genome Atlas(TCGA)數據庫(
1.2 CIRBP 基因在 TCGA-LUAD 數據庫中的表達
使用 R(v4.0.2)軟件讀取整理好的 TCGA-LUAD 數據庫中基因表達數據,應用“limma”包和“beeswarm”包統計分析 CIRBP 在 LUAD 組織和癌旁組織差異表達情況,繪制出 CIRBP 表達散點差異圖和配對表達差異圖。
1.3 臨床病理特征相關性分析
使用 R(v4.0.2)軟件分別讀取 TCGA-LUAD 和 GEO-LUAD 基因表達數據及臨床資料數據,應用 Kruskal-Wallis H 檢驗分析方法分別對 LUAD 患者 T 分期和 N 分期進行分析,以了解 CIRBP 表達分別與 T 分期和 N 分期的關系。
1.4 生存曲線分析及總生存期相關 Cox 回歸分析
使用 R(v4.0.2)軟件分別讀取 TCGA-LUAD 和 GEO-LUAD 基因表達數據及臨床資料數據,應用“survival”程序包,將樣本中 CIRBP 相關 miRNA 表達的中位數作為分界點,將患者分為高低表達兩組,分析 LUAD 中 CIRBP 基因高表達組和低表達組的生存情況。與此同時,基于 GEO-LUAD 基因表達數據及臨床資料數據,應用“survival”及“survminer”程序包對 CIRBP 表達量、年齡、性別、T 分期、N 分期與總生存期進行相關性的單因素和多因素 Cox 回歸分析,并繪制森林圖。其中性別、T 分期及 N 分期以分類變量的形式進行 Cox 回歸分析,分別以女性、T1 和 N1 作為參照。
1.5 GO分析及KEGG分析
用樣本中 CIRBP 相關 miRNA 表達中位數將樣本分為高低表達兩組,設定 |logFc(高表達組基因表達量/低表達組中基因表達量)|≥0.5,adj.P≤0.05,應用“limma”包獲取差異基因。使用 R(v4.0.2)軟件讀取差異基因文件,設定 Q≤0.05,應用“BiocManager”、“clusterProfiler”、“DOSE”及“enrichplot”程序包分別進行 GO 富集分析和 KEGG 富集分析,結果輸出為氣泡圖。
1.6 構建蛋白互作網絡
將 CIRBP 相關核心差異基因導入 STRING(
1.7 統計學分析
數據匯總整理后,采用 R(v4.0.2)軟件以及 SPSS Statistics 25.0 軟件進行分析。使用 Mann-Whitney U 檢驗分析基因在 LUAD 組織和癌旁組織中的表達差異。Kaplan-Meierr 法分析基因表達與 LUAD 患者生存的關系。T 分期、N 分期采用 Kruskal-Wallis H 檢驗進行分析。單因素和多因素 Cox 回歸模型用于分析 CIRBP 在 LUAD 患者中的預后意義。P≤0.05 為差異具有統計學意義。
2 結果
2.1 LUAD 組織與癌旁組織中 CIRBP 的表達差異
對 TCGA-LUAD 數據中非配對 LUAD 及癌旁樣本應用 R(v4.0.2)軟件采用 Mann-Whitney U 檢驗進行分析,結果表明 CIRBP 基因在 LUAD 組織中的表達水平較癌旁組織顯著下降(P<0.01,圖 1a)。進一步對 TCGA-LUAD 數據庫中 57 例同時包含癌組織及癌旁組織的樣本進行檢驗,結果顯示 LUAD 組織樣本中 CIRBP 基因表達量仍顯著低于癌旁組織(P<0.01,圖 1b)。

a:TCGA-LUAD 數據庫中 CIRBP 在肺腺癌組織(535 例)和癌旁肺組織(59 例)中的表達比較;b:57 例配對的肺腺癌組織和癌旁組織中 CIRBP 表達比較
2.2 CIRBP 基因表達與 LUAD 患者臨床病理特征相關性分析
分別對 TCGA-LUAD 和 GEO-LUAD 數據中 LUAD 患者 T 分期及 N 分期進行分析后,發現兩數據庫中 LUAD CIRBP 基因的表達水平均與 LUAD 患者的 T 分期(圖 2a~b)、N 分期(圖 2c~d)相關,且隨著分期的增高 CIRBP 基因的表達水平有下降趨勢。

a:TCGA-LUAD 數據中 T 分期分析(T1 期 172 例,T2 期 281 例,T3 期 47 例,T4 期 19 例);b:GEO-LUAD 數據中 T 分期分析(T1期 149 例,T2 期 251 例,T3 期 28 例,T4 期 11 例);c:TCGA-LUAD 數據中 N 分期分析(N0 期 335 例,N1 期 98 例,N2 期 75 例,N3 期 2 例);d:GEO-LUAD 數據中 N 分期分析(N0 期 299 例,N1 期 87 例,N2 期 53 例)
2.3 CIRBP 表達水平與 LUAD 患者預后的關系
使用 Kaplan-Meier 法分析 TCGA-LUAD 數據中 LUAD CIRBP 基因高低表達兩組總體生存率的差異,結果發現,高表達 CIRBP 患者的總體生存率顯著高于低表達組,說明 CIRBP 表達水平與 LUAD 患者預后相關(P=0.004,圖 3a)。同時對 GEO-LUAD 數據庫中 LUAD 樣本再次驗證,得出同樣的分析結果,CIRBP 表達水平與 LUAD 患者預后呈正相關(P<0.001,圖 3b)。并對 GEO-LUAD 數據進行單因素及多因素 Cox 回歸分析(表 1,圖 4),結果說明,CIRBP 可以作為 LUAD 患者的獨立預后因素。


a:TCGA-LUAD 數據庫中,CIRBP 表達水平與肺腺癌患者總體生存率的生存曲線圖;b:GEO-LUAD 數據庫中,CIRBP 表達水平與肺腺癌患者總體生存率的生存曲線圖

2.4 GO 和 KEGG 富集分析
為了解 CIRBP 在 LUAD 中與其相關核心基因的功能,包括分子功能、細胞組成及生物學過程,因此我們在基因本體中進行 GO 功能注釋。結果顯示其富集的生物學功能主要表現在細胞器裂變、核分裂、有絲分裂核分裂、染色體分離、核染色體分離、姐妹染色單體分離及 DNA 復制等(圖 5)。同時,為進一步了解 CIRBP 在 LUAD 中參與的相關信號通路,我們對其進行了 KEGG 通路富集分析。通過分析發現 CIRBP 與相關核心基因主要參與了細胞周期、谷胱甘肽代謝、DNA 復制、補體和凝血級聯、類風濕性關節炎、人類 T 細胞白血病病毒 1 感染及白細胞介素 17信號通路等的調節(圖 6)。


2.5 蛋白互作網絡
為了更好地了解 CIRBP 在 LUAD 中的相互作用關系,因此我們將 CIRBP 及篩選的 79 個核心差異基因導入 STRING 數據庫構建 CIRBP 的蛋白互作網絡,結果顯示 CIRBP 與細胞周期蛋白 B2(cyclin B2,CCNB2)具有相互聯系(圖 7)。為進一步了解兩者之間的關系,通過 GEPIA 在線分析發現 CIRBP 基因與 CCNB2 基因的表達呈負相關(P<0.001,R=–0.36,圖 8)。


3 討論
既往研究[18]表明,CIRBP 不僅可作為炎癥介質參與炎癥過程,還與腫瘤的發生和發展密切相關。Brochu 等[19]發現 CIRBP 可能通過激活核轉錄因子κB(nuclear factor κB,NF-κB)途徑刺激促炎細胞因子的釋放。Chen 等[20]通過一項肺冷應激模型研究驗證了 CIRBP 可通過 TLR4/NF-κB 途徑介導組織損傷、炎癥發生和黏液分泌增加。但 CIRBP 也被證實可以減輕炎癥反應,一項傷口愈合的研究[21]表明,在 CIRBP 基因敲除小鼠中,腫瘤壞死因子-α 的表達增加了 65 倍,而在野生型小鼠中只增加了 16 倍,這表明 CIRBP 可以減輕創傷相關的炎癥。在腫瘤的發生發展中,CIRBP 也扮演著不同的角色,其可促癌也可抑癌。在促癌方面,Guo 等[15]發現 CIRBP 在多個乳腺癌細胞系中過表達,其過表達與細胞周期蛋白 E1(cyclin E1)上調、促進增殖、減少凋亡有關。Gao 等[22]證實cyclin E1正向調節細胞周期,是乳腺癌預后不良的標志。另外,Indacochea等[23]發現 CIRBP 轉錄水平與乳腺癌常見的 luminal A/B 型患者的不良預后相關,這可能是 CIRBP 下調半胱氨酸蛋白酶抑制劑 C的 mRNA 水平,促進了乳腺癌細胞的致癌作用。近期,Dankner 等[24]對 164 例腦轉移瘤患者的骨髓和轉移瘤鄰近腦組織進行單細胞 RNA 測序,通過分析發現,與在轉移區域內的腫瘤細胞相比,在侵襲性腫瘤細胞中 CIRBP 過表達,并通過異種移植物模型實驗驗證,說明了CIRBP的過表達是腫瘤細胞在大腦中侵襲所必須的,驅動了腫瘤手術切除后患者腦轉移的復發。這都說明了 CIRBP 在腫瘤的發生發展中扮演著重要的促癌角色。在抑癌方面,Hamid 等[16]發現 CIRBP 在正常子宮內膜中的表達始終最高,在子宮內膜增生癥中的表達變化不明顯,而在癌中的表達顯著降低且與預后相關。同時研究表明在月經周期中,正常子宮內膜中 CIRBP 的表達與增殖標記物 Ki-67 呈負相關,這與其抑制增殖的作用是一致的。另外,一項基于生物信息學分析并實驗驗證的研究[17]表明,CIRBP 基因過表達后,腎癌細胞中遷移相關蛋白 N-cadherin 表達明顯降低,E-cadherin 水平明顯增高,而 AKT 通路關鍵蛋白 p-AKT 和 p-GSK3β 的表達水平明顯下調,且與腎癌患者預后呈正相關。然而,CIRBP 基因在 LUAD 的發生發展中扮演的角色尚無相關研究。
本研究首先通過對 TCGA-LUAD 數據庫的挖掘,發現 LUAD 中 CIRBP 基因在 LUAD 組織中較正常肺組織表達顯著下降,同時生存分析曲線表明 CIRBP 基因低表達患者生存期較高表達患者縮短。我們使用 GEO-LUAD 數據庫中數據進行再次驗證,得出了與上述一致的結果。通過單因素及多因素 Cox 分析結果顯示 CIRBP 可以作為 LUAD 患者的獨立預后因素。這提示著 CIRBP 在 LUAD 中可能是一個重要的抑癌基因,參與了 LUAD 的發生發展。我們進一步利用 TCGA-LUAD 及 GEO-LUAD 數據庫中 LUAD 數據,分別分析 CIRBP 基因與 LUAD 患者病理特征之間關系,我們發現 CIRBP 基因表達水平與 LUAD 患者 T 分期、N 分期顯著相關,且兩數據庫結論可相互驗證。但在圖 2b 中 CIRBP 表達在 T4 期低于 T3 期,圖 2c 中其表達 N3 期低于 N2 期,存在這樣的問題可能在于 GEO 及 TCGA 數據庫所納入的 LUAD 處于 T4 期和 N3 期的樣本量少,待樣本量擴充后可再行分析。為進一步了解目的基因在 LUAD 中參與的功能及作用通路,GO 功能注釋結果顯示其富集的生物學功能主要表現在細胞器裂變、核分裂、有絲分裂核分裂、染色體分離及 DNA 復制等,KEGG 分析發現 CIRBP 主要參與細胞周期、谷胱甘肽代謝、DNA 復制等通路。在一項小鼠睪丸熱應激的研究中,Xu 等[25]發現 CIRBP 可能在轉錄水平上調節 Sam68 的表達和磷酸化 ERK1/2 蛋白的表達,以影響小鼠睪丸和小鼠原代精母細胞的有絲分裂過程,從而防止小鼠受熱應激引起的睪丸損傷。Masuda 等[26]發現在培養的小鼠胚胎成纖維細胞中,CIRBP 蛋白可以通過與 Dyrk1b/Mirk 的相互作用來調節 p27 和細胞周期蛋白 D1 的磷酸化和穩定,并加速細胞周期從 G0 到 G1 階段以及從 G1 到 S 期的進展。Zhang 等[27]發現 CIRBP 的過表達可以挽救 1% 氧氣對神經干細胞的細胞周期蛋白 D1 表達和細胞周期進展的抑制作用,這表明 CIRBP 可調節神經干細胞增殖過程。但目前暫無 CIRBP 在 LUAD 中作用機制的研究報道。
通過構建蛋白互作網絡我們發現 CIRBP 與CCNB2具有相互聯系,且通過 GEPIA 在線分析發現兩者的表達呈負相關。目前研究發現 CCNB2 是細胞周期蛋白家族成員之一,在 G2/M 轉化過程中起關鍵作用,已被發現在人類腫瘤中表達上調[28]。Wang 等[29]基于生物信息學分析發現 CCNB2 在 LUAD 患者中高表達,可作為 LUAD 患者預后不良的生物標志物。而且通過細胞功能實驗證實沉默 CCNB2 對 LUAD 細胞增殖、遷移和侵襲均有抑制作用,細胞周期阻滯于 G0/G1 期。這可能提示著 CIRBP/CCNB2 軸影響著 LUAD 的發生發展,但目前關于 CIRBP 與 CCNB2 間的相互聯系和作用機制尚無相關文獻報道,這有待實驗進一步證實。
綜上所述,本研究主要通過生物信息學分析了 CIRBP 在 LUAD 中的表達及臨床意義,發現 CIRBP 基因可能會成為 LUAD 臨床預后評估的指標以及靶向治療的新靶點,并且初步探討了 CIRBP 在 LUAD 中可能參與的信號通路。但同時上述結果僅來源于大數據分析,存在明顯的局限性。我們目前正在同步從臨床角度及基礎實驗方面驗證,進一步研究 CIRBP 對 LUAD 細胞的增殖、凋亡、侵襲轉移等方面的影響,并深入探討該基因在 LUAD 中的致病機制,以期為后續研究提供新思路和新依據。
利益沖突:無。
作者貢獻:肖翠負責論文設計、數據整理分析、論文撰寫與修改;楊建寶、王成參與選題,負責論文審閱與修改;孫移明、李璇、李政負責數據處理、論文審閱;劉炎斌、安海鳴負責對文章的知識性內容做批判性審閱。