引用本文: 張江濤, 阮暉朝, 吳向華. 生物信息學分析 CA3 在乳腺癌組織中的表達和對預后的影響. 中國普外基礎與臨床雜志, 2022, 29(1): 51-58. doi: 10.7507/1007-9424.202104102 復制
乳腺癌是一種好發于女性、晚期可伴發腋窩淋巴結轉移的惡性腫瘤。根據最新權威統計[1],乳腺癌已成為全球最常見的惡性腫瘤,且是導致女性死亡的首要惡性腫瘤。在過去的幾十年中,乳腺癌的治療已經取得了長足的進展。早期乳腺癌通過手術、化療和放療能在一定程度上改善患者的生存狀況,5 年生存率達到 80%~90%。然而仍有部分乳腺癌無法治愈,特別是晚期乳腺癌[2-3]。隨著分子生物學的不斷發展,分子靶向治療方式逐漸引起國內外學者的關注。探索乳腺癌相關標志物有利于乳腺癌的靶向治療并且能夠了解疾病發生發展的分子機制。
碳酸酐酶(carbonic anhydrase,CA)家族是一種催化二氧化碳可逆水合作用的含鋅金屬酶,可調節細胞離子轉運和 pH 穩態。目前 CA 已成為多種疾病的治療靶標,包括青光眼和癲癇發作、高原反應、肥胖、疼痛治療和腫瘤[4]。與其他家族成員不同,CA3 有 2 個反應性巰基,通過二硫鍵可逆結合到谷胱甘肽,可避免細胞受到氧化應激的傷害[5]。越來越多的證據表明 CA3 參與腫瘤的發生發展。轉錄輔助激活因子 Yes 相關蛋白 1(Yes-associated protein 1,YAP1)在多種腫瘤組織高表達且能夠促進癌細胞的增殖,與惡性腫瘤患者的預后不佳具有密切聯系[6-7]。CA3 能夠作用于 YAP1 繼而抑制間皮瘤細胞和胃癌細胞的生長[8]。有研究者[9]通過生物信息學與細胞實驗發現,CA3 具有作為口腔癌預后標志物的潛能。然而 CA3 與乳腺癌之間的關系目前研究較少。
本研究基于癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)、基因表達數據庫(GEO)、基因型組織表達(the Genotype-Tissue Expression,GETX)和瑞典癌癥分析網絡-乳腺(The Sweden Cancerome Analysis Network-Breast,SCAN-B)數據的在線分析工具,使用基因表達譜交互式分析 2.0(Gene Expression Profiling Interactive Analysis 2.0,GEPIA2.0)、腫瘤免疫評估資源(tumor immune estimation resource,TIMER)和 Kaplan-Meier 繪圖儀(Kaplan-Meier Plotter)、PrognoScan 和 Bc-GenExMinerv4.7 在線分析工具驗證 CA3 mRNA 在乳腺癌組織和正常乳腺組織中的差異表達和預后潛能,基于 LinkedOmics 數據庫篩選 CA3 在乳腺癌組織中的共表達基因,并分析篩選出的前 50 個基因的預后潛能和富集的生物學行為。最后通過 TIMER 數據庫探討 CA3 在乳腺癌組織中與免疫細胞的相關性。
1 材料與方法
1.1 3 個數據庫中 CA3 mRNA 在乳腺癌中的表達情況分析
GEPIA2.0 數據庫(
1.2 3 個數據庫中 CA3 mRNA 表達水平與乳腺癌預后關系分析
Kaplan-Meier 繪圖儀數據庫[12](
1.3 CA3 在乳腺癌中的共表達網絡和通路分析
通過 LinkedOmics 數據庫(
1.4 乳腺癌組織中 CA3 mRNA 表達與免疫微環境的關系分析
在 TIMER 數據庫中,通過去卷積從基因表達譜推導腫瘤浸潤免疫細胞(TIIC)的豐度,分析乳腺癌組織中 CA3 mRNA 表達與腫瘤純度及免疫細胞包括 B 細胞、CD4+ T 細胞、CD8+ T 細胞、中性粒細胞、巨噬細胞和樹突狀細胞的關系。通過調節腫瘤純度,使用 Spearman 相關性檢驗了解 CA3 mRNA表達與多種免疫細胞標志物的關系。
1.5 統計學方法
采用t檢驗或單因素方差分析比較基于GEPIA2.0和 TIMER 數據庫的 CA3 mRNA 表達水平的差異;在 Bc-GenExMinerv4.7 數據庫多組間比較采用 Dunnett-Tukey-Kramer 檢驗;使用 Kaplan-Meier 生存分析法判斷 CA3 mRNA 表達水平與乳腺癌患者預后的關系,采用 log-rank 檢驗計算高低表達水平(以中位數區分)的生存差異得出 P 值;采用 Pearson 相關性檢驗計算 CA3 共表達基因;使用 Spearman 相關性檢驗,通過調節腫瘤純度,分析 CA3 mRNA 表達與免疫細胞標志基因的關系。檢驗水準 α=0.05。
2 結果
2.1 CA3 mRNA 在正常乳腺組織和乳腺癌組織中的差異表達
為了避免單一數據庫帶來的不確定性和差異性,因此對 TIMER 和 GEPIA2.0 數據庫資料進行分析,比較乳腺癌組織和正常乳腺組織中 CA3 mRNA表達水平的差異,結果 TIMER 數據庫(圖 1a,P<0.001)和 GEPIA2.0 數據庫(圖 1b、1c,P<0.05)資料一致發現,在乳腺癌組織中 CA3 mRNA 表達顯著下調,初步提示檢測 CA3 mRNA 的表達可用于臨床診斷乳腺癌。

a:TIMER 數據庫中 CA3 mRNA 在乳腺癌組織和正常乳腺組織以及其他腫瘤組織中的表達,***
2.2 CA3 mRNA 表達與乳腺癌分子分型標志物、淋巴轉移狀態、PAM50 亞分類以及 NPI 和 SBR 分級的關系
基于 Bc-GenExMinerv4.7 數據庫資料分析結果顯示,CA3 mRNA 表達水平與 Ki67、ER、PR和HER2的表達狀態以及淋巴轉移均具有相關性(P<0.05),并且 CA3 mRNA 表達水平在乳腺癌 SBR 分級和 NPI 分級中呈逐級遞減趨勢 (P<0.05);CA3 mRNA表達在乳腺癌 PAM50 分類中,除Luminal B 型與 HER2 過表達型的比較差異無統計學意義外(P>0.1)其余的比較差異均具有統計學意義(P<0.05),正常乳腺樣型中 CA3 mRNA 表達水平最高。具體見圖 1d-1k。以上結果提示 CA3 具有作為乳腺癌分子分型標志物的潛能。
2.3 CA3 mRNA 的表達與乳腺癌預后的關系
為克服單一數據庫造成的說服力不足,本研究分析了 2 個數據庫的資料。Kaplan-Meier 繪圖儀數據庫資料分析結果顯示,乳腺癌組織中 CA3 mRNA低表達患者的 OS [HR=0.79,95%CI 為(0.65,0.95),P=0.012] 和 RFS [HR=0.83,95%CI 為(0.75,0.92),P<0.001] 均低于 CA3 mRNA 高表達者(圖 1l、1m);BC-GenExMinerv4.7 數據庫資料分析結果具有相同的趨勢:CA3 mRNA 低表達患者的 OS [HR=0.72,95%CI 為(0.59,0.87),P<0.001] 和DFS [HR=0.72,95%CI 為(0.59,0.87),P<0.001]均低于 CA3 mRNA 高表達者(圖 1n、1o)。進一步對 PrognoScan 數據庫資料進行分析,對于乳腺癌患者的預后 GEO 多個數據集分析結果顯示 CA3 mRNA 高表達是有利因素,即 CA3 mRNA 高表達與乳腺癌患者的良好預后相關(表 1)。

2.4 在乳腺癌組織中 CA3 共表達基因篩選以及正負相關各前 50 個基因的預后分析結果
使用 LinkedOmics 數據庫,采用 Pearson統計學方法,計算分析得出正負相關各前 50 個與 CA3 共表達的基因。與 CA3 呈正相關中的前 3 個基因分別是 S100B、CA13 和 ALDH1L1,呈負相關的前 3 個基因分別是 SEPHS2、SRXN1 和 SLC9A3R1。使用 GEPIA2.0 數據庫分析了 LinkedOmics 數據庫篩選得到的正負相關各前 50 個共表達基因的表達與患者預后的關系,結果顯示正相關基因中有 10/50 個基因與患者預后相關,具有低風險比,P<0.05;負相關基因中有 11/50 個基因與患者預后相關,具有高風險比,P<0.05(表 2)。利用 LinkedOmics 數據庫 Linkinterpreter 模塊對共表達基因進行 KEGG 通路分析,其結果顯示:CA3 及其負相關基因涉及了 4 項生物學行為,具體見表 3。


2.5 乳腺癌組織中 CA3 mRNA 表達與免疫細胞浸潤的關系
使用 TIMER 數據庫的 gene 模塊,評估 CA3 mRNA 表達與乳腺癌組織中免疫細胞浸潤的關系,結果顯示:CA3 mRNA 表達與腫瘤純度和 B 細胞數量呈負相關(rs=–0.229,P<0.001;rs=–0.075,P<0.05),與 CD4+ T 細胞和 CD8+ T 細胞數量呈正相關(rs=0.175,P<0.001;rs=0.137,P<0.001);但與巨噬細胞、樹突狀細胞和中性粒細胞數量無相關性(rs=–0.008,P>0.05;rs=0.023,P>0.05;rs=0.055,P>0.05),具體見圖 2。該結果提示 CA3 在調節 T 細胞方面發揮一定的作用。本研究進一步分析了 T 細胞亞型標志基因與 CA3 mRNA 表達的關系,結果顯示 CA3 mRNA 表達與 Th2 中的 STAT5A(rs=0.244,P<0.001)、Tfh 中的 BCL6(rs=0.209,P<0.001)和 Th17 中的 STAT3(rs=0.107,P<0.001)標志基因呈正相關,與 T 細胞衰竭標志物例如淋巴細胞活化基因 3(LAG3)、重組人 T 細胞免疫球蛋白黏蛋白 3(TIM-3)和脊髓灰質炎病毒受體相關 2(PVRL2)呈負相關(rs=–0.100,P<0.01;rs=–0.143,P<0.01;rs=–0.082,P<0.05),具體見表 4。


3 討論
隨著醫學的快速發展,生物信息學成為了促進醫學進展的新方法[16]。基于大樣本測序數據,利用生物信息學有利于快速確定腫瘤關鍵治療靶點。乳腺癌目前已經成為全球最高發的惡性腫瘤之一,對女性健康造成巨大的挑戰。因此有必要探索更多的乳腺癌的相關分子靶點,為未來乳腺癌治療提供新方向。
本研究基于 GEPIA2.0 和 TIMER 數據庫資料分析發現,CA3 mRNA 的表達相較于乳腺正常組織,在癌組織中呈低表達;通過 Bc-GenExMinerv4.7 數據庫資料分析,在 ER 陰性、PR 陰性、HER2 陰性和無淋巴轉移乳腺癌中,CA3 mRNA 表達水平較高。Ki67 是一種增殖抗原,有利于腫瘤細胞的生長增殖,可作為乳腺癌預后評估指標[17]。本研究發現,CA3 mRNA 高表達者乳腺癌組織中 Ki67 呈低表達。對乳腺癌患者進行正確的分級有利于最大程度評估患者的預后,選擇合適的治療手段。SBR 分級和 NPI 分級作為目前乳腺癌患者分級的主要手段之一,本研究發現 CA3 mRNA 表達水平隨著 SBR 和 NPI 分級的增高依次降低,提示將來 CA3 mRNA 表達水平或許可以作為相關分級的指標。在正常乳腺樣型中 CA3 mRNA 表達水平最高,Luminal B 型和 HER2 過表達型的 CA3 mRNA 表達水平最低。通過 Kaplan-Meier 繪圖儀數據庫和 Bc-GenExMinerv4.7 數據庫資料分析發現,CA3 mRNA 表達水平低的乳腺癌患者其 OS、RFS 和 DFS 較低,PrognoScan 數據庫在線分析 GEO 多個數據集也發現具有相同趨勢。該初步結果提示,CA3 具有可能作為乳腺癌預后標志物的潛能。
為了進一步了解 CA3 如何參與乳腺癌的發生與發展,本研究通過 LinkedOmics 數據庫,分析了 CA3 共表達基因,并分析了正負相關各前 50 位共表達基因與乳腺癌預后的關系,正相關基因中有 10 個基因與患者預后相關,具有低風險比,P<0.05;負相關基因中有 12 個基因與患者預后相關,具有高風險比,P<0.05。前 3 位的正相關基因 S100B、CA13 和 ALDH1L1 均有學者[18-20]發現其參與抑制乳腺癌的生長。負相關的前 3 位基因中,SEPHS2 在三陰性乳腺癌中過表達,在未來 SEPHS2 相關抑制劑可能是三陰性乳腺癌患者治療的新方向[21];SRXN1 與 SLC9A3R1 均有研究[22-23]表明參與了乳腺癌的發生。這提示 CA3 具有作為乳腺癌預后生物標志物的潛力。
腫瘤細胞的生長依賴腫瘤的發生、生長及轉移,與腫瘤細胞所處的內外環境有著密切的關系[24]。本研究通過 TIMER 數據庫資料分析發現,CA3 mRNA 表達與腫瘤純度和 B 細胞數量呈負相關關系,與 CD4+ T 細胞和 CD8+ T 細胞數量呈正相關關系,提示 CA3 在調控乳腺癌腫瘤微環境方面具有一定的作用。免疫微環境影響著腫瘤的發生發展,CD4+ T 細胞和 CD8+ T 細胞具有抗腫瘤作用[25]。基于腫瘤純度調整后,本研究發現 CA3 mRNA 表達與 Th2(STAT6、STAT5A、IL13)、Tfh(BCL6)和 Th17(STAT3、IL17A)細胞相關標志物正相關關系,與調節性 T 細胞(FOXP3、CCR8、IL2RA)呈負相關關系,與 T 細胞衰竭標志物 PVRL2、LAG3 和 TIM-3 呈負相關關系。免疫檢查點抑制劑是免疫治療的關鍵點,其中的 PD-1 和 CTLA4 已經被批準在臨床上用于腫瘤的治療,LAG3 和 TIM-3 抑制劑在未來惡性腫瘤的免疫治療中具有巨大的潛能[26]。
為了了解 CA3 在乳腺癌中的調控機制,本研究基于 LinkedOmics 數據庫進行 KEGG 基因富集分析,CA3 及其負相關基因涉及的生物學行為包括氧化磷酸化、溶酶體、內質網中的蛋白質加工和蛋白酶體。二甲雙胍是一種氧化磷酸化抑制劑,不僅能用于糖尿病的治療,而且可損壞線粒體功能抑制腫瘤細胞生長,并且通過激活腫瘤抗原特異性細胞毒性 T 淋巴細胞特異性殺傷腫瘤細胞[27-28]。有研究[29]發現,T 細胞衰竭往往表現出更高的糖酵解和受損的線粒體功能,抗氧化劑能夠一定程度上逆轉 T 細胞衰竭。由于 CA3 的特殊結構能夠保護細胞免受氧化應激的傷害,低表達 CA3 可能導致 T 細胞衰竭,發生腫瘤免疫逃逸。干細胞信號轉導通路 Hippo/YAP1、Wnt/β-catenin 和 Hedgehog 在腫瘤干細胞的生長和化療耐藥性方面發揮重要作用。有研究[30]表明,CA3 可減少 YAP1 和 Ki67 在腫瘤干細胞的蛋白表達,從而抑制腫瘤細胞的生長,具體機制尚不清楚。國內有學者[31-32]的研究結果提示,CA3 能夠有效抑制肺癌和結腸癌細胞株的生長。以上研究結果表明 CA3 是乳腺癌的負性調節因子,低表達 CA3 可能通過氧化磷酸化途徑,降低腫瘤免疫力,參與乳腺癌的發生發展。
本研究只是基于目前公共數據庫資料的分析結果,沒有進行體內外實驗驗證;另外,由于 TCGA、GEO 等數據庫樣本數量、質量和統計學方式的變化也可會導致分析結果發生改變。因此有必要進行進一步的驗證。但無論怎樣,本研究通過以上數據庫資料的初步分析結果表明,CA3 有作為乳腺癌潛在標志物的可能。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張江濤負責論文撰寫;阮暉朝負責數據下載與整理;吳向華負責文章審核。
乳腺癌是一種好發于女性、晚期可伴發腋窩淋巴結轉移的惡性腫瘤。根據最新權威統計[1],乳腺癌已成為全球最常見的惡性腫瘤,且是導致女性死亡的首要惡性腫瘤。在過去的幾十年中,乳腺癌的治療已經取得了長足的進展。早期乳腺癌通過手術、化療和放療能在一定程度上改善患者的生存狀況,5 年生存率達到 80%~90%。然而仍有部分乳腺癌無法治愈,特別是晚期乳腺癌[2-3]。隨著分子生物學的不斷發展,分子靶向治療方式逐漸引起國內外學者的關注。探索乳腺癌相關標志物有利于乳腺癌的靶向治療并且能夠了解疾病發生發展的分子機制。
碳酸酐酶(carbonic anhydrase,CA)家族是一種催化二氧化碳可逆水合作用的含鋅金屬酶,可調節細胞離子轉運和 pH 穩態。目前 CA 已成為多種疾病的治療靶標,包括青光眼和癲癇發作、高原反應、肥胖、疼痛治療和腫瘤[4]。與其他家族成員不同,CA3 有 2 個反應性巰基,通過二硫鍵可逆結合到谷胱甘肽,可避免細胞受到氧化應激的傷害[5]。越來越多的證據表明 CA3 參與腫瘤的發生發展。轉錄輔助激活因子 Yes 相關蛋白 1(Yes-associated protein 1,YAP1)在多種腫瘤組織高表達且能夠促進癌細胞的增殖,與惡性腫瘤患者的預后不佳具有密切聯系[6-7]。CA3 能夠作用于 YAP1 繼而抑制間皮瘤細胞和胃癌細胞的生長[8]。有研究者[9]通過生物信息學與細胞實驗發現,CA3 具有作為口腔癌預后標志物的潛能。然而 CA3 與乳腺癌之間的關系目前研究較少。
本研究基于癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)、基因表達數據庫(GEO)、基因型組織表達(the Genotype-Tissue Expression,GETX)和瑞典癌癥分析網絡-乳腺(The Sweden Cancerome Analysis Network-Breast,SCAN-B)數據的在線分析工具,使用基因表達譜交互式分析 2.0(Gene Expression Profiling Interactive Analysis 2.0,GEPIA2.0)、腫瘤免疫評估資源(tumor immune estimation resource,TIMER)和 Kaplan-Meier 繪圖儀(Kaplan-Meier Plotter)、PrognoScan 和 Bc-GenExMinerv4.7 在線分析工具驗證 CA3 mRNA 在乳腺癌組織和正常乳腺組織中的差異表達和預后潛能,基于 LinkedOmics 數據庫篩選 CA3 在乳腺癌組織中的共表達基因,并分析篩選出的前 50 個基因的預后潛能和富集的生物學行為。最后通過 TIMER 數據庫探討 CA3 在乳腺癌組織中與免疫細胞的相關性。
1 材料與方法
1.1 3 個數據庫中 CA3 mRNA 在乳腺癌中的表達情況分析
GEPIA2.0 數據庫(
1.2 3 個數據庫中 CA3 mRNA 表達水平與乳腺癌預后關系分析
Kaplan-Meier 繪圖儀數據庫[12](
1.3 CA3 在乳腺癌中的共表達網絡和通路分析
通過 LinkedOmics 數據庫(
1.4 乳腺癌組織中 CA3 mRNA 表達與免疫微環境的關系分析
在 TIMER 數據庫中,通過去卷積從基因表達譜推導腫瘤浸潤免疫細胞(TIIC)的豐度,分析乳腺癌組織中 CA3 mRNA 表達與腫瘤純度及免疫細胞包括 B 細胞、CD4+ T 細胞、CD8+ T 細胞、中性粒細胞、巨噬細胞和樹突狀細胞的關系。通過調節腫瘤純度,使用 Spearman 相關性檢驗了解 CA3 mRNA表達與多種免疫細胞標志物的關系。
1.5 統計學方法
采用t檢驗或單因素方差分析比較基于GEPIA2.0和 TIMER 數據庫的 CA3 mRNA 表達水平的差異;在 Bc-GenExMinerv4.7 數據庫多組間比較采用 Dunnett-Tukey-Kramer 檢驗;使用 Kaplan-Meier 生存分析法判斷 CA3 mRNA 表達水平與乳腺癌患者預后的關系,采用 log-rank 檢驗計算高低表達水平(以中位數區分)的生存差異得出 P 值;采用 Pearson 相關性檢驗計算 CA3 共表達基因;使用 Spearman 相關性檢驗,通過調節腫瘤純度,分析 CA3 mRNA 表達與免疫細胞標志基因的關系。檢驗水準 α=0.05。
2 結果
2.1 CA3 mRNA 在正常乳腺組織和乳腺癌組織中的差異表達
為了避免單一數據庫帶來的不確定性和差異性,因此對 TIMER 和 GEPIA2.0 數據庫資料進行分析,比較乳腺癌組織和正常乳腺組織中 CA3 mRNA表達水平的差異,結果 TIMER 數據庫(圖 1a,P<0.001)和 GEPIA2.0 數據庫(圖 1b、1c,P<0.05)資料一致發現,在乳腺癌組織中 CA3 mRNA 表達顯著下調,初步提示檢測 CA3 mRNA 的表達可用于臨床診斷乳腺癌。

a:TIMER 數據庫中 CA3 mRNA 在乳腺癌組織和正常乳腺組織以及其他腫瘤組織中的表達,***
2.2 CA3 mRNA 表達與乳腺癌分子分型標志物、淋巴轉移狀態、PAM50 亞分類以及 NPI 和 SBR 分級的關系
基于 Bc-GenExMinerv4.7 數據庫資料分析結果顯示,CA3 mRNA 表達水平與 Ki67、ER、PR和HER2的表達狀態以及淋巴轉移均具有相關性(P<0.05),并且 CA3 mRNA 表達水平在乳腺癌 SBR 分級和 NPI 分級中呈逐級遞減趨勢 (P<0.05);CA3 mRNA表達在乳腺癌 PAM50 分類中,除Luminal B 型與 HER2 過表達型的比較差異無統計學意義外(P>0.1)其余的比較差異均具有統計學意義(P<0.05),正常乳腺樣型中 CA3 mRNA 表達水平最高。具體見圖 1d-1k。以上結果提示 CA3 具有作為乳腺癌分子分型標志物的潛能。
2.3 CA3 mRNA 的表達與乳腺癌預后的關系
為克服單一數據庫造成的說服力不足,本研究分析了 2 個數據庫的資料。Kaplan-Meier 繪圖儀數據庫資料分析結果顯示,乳腺癌組織中 CA3 mRNA低表達患者的 OS [HR=0.79,95%CI 為(0.65,0.95),P=0.012] 和 RFS [HR=0.83,95%CI 為(0.75,0.92),P<0.001] 均低于 CA3 mRNA 高表達者(圖 1l、1m);BC-GenExMinerv4.7 數據庫資料分析結果具有相同的趨勢:CA3 mRNA 低表達患者的 OS [HR=0.72,95%CI 為(0.59,0.87),P<0.001] 和DFS [HR=0.72,95%CI 為(0.59,0.87),P<0.001]均低于 CA3 mRNA 高表達者(圖 1n、1o)。進一步對 PrognoScan 數據庫資料進行分析,對于乳腺癌患者的預后 GEO 多個數據集分析結果顯示 CA3 mRNA 高表達是有利因素,即 CA3 mRNA 高表達與乳腺癌患者的良好預后相關(表 1)。

2.4 在乳腺癌組織中 CA3 共表達基因篩選以及正負相關各前 50 個基因的預后分析結果
使用 LinkedOmics 數據庫,采用 Pearson統計學方法,計算分析得出正負相關各前 50 個與 CA3 共表達的基因。與 CA3 呈正相關中的前 3 個基因分別是 S100B、CA13 和 ALDH1L1,呈負相關的前 3 個基因分別是 SEPHS2、SRXN1 和 SLC9A3R1。使用 GEPIA2.0 數據庫分析了 LinkedOmics 數據庫篩選得到的正負相關各前 50 個共表達基因的表達與患者預后的關系,結果顯示正相關基因中有 10/50 個基因與患者預后相關,具有低風險比,P<0.05;負相關基因中有 11/50 個基因與患者預后相關,具有高風險比,P<0.05(表 2)。利用 LinkedOmics 數據庫 Linkinterpreter 模塊對共表達基因進行 KEGG 通路分析,其結果顯示:CA3 及其負相關基因涉及了 4 項生物學行為,具體見表 3。


2.5 乳腺癌組織中 CA3 mRNA 表達與免疫細胞浸潤的關系
使用 TIMER 數據庫的 gene 模塊,評估 CA3 mRNA 表達與乳腺癌組織中免疫細胞浸潤的關系,結果顯示:CA3 mRNA 表達與腫瘤純度和 B 細胞數量呈負相關(rs=–0.229,P<0.001;rs=–0.075,P<0.05),與 CD4+ T 細胞和 CD8+ T 細胞數量呈正相關(rs=0.175,P<0.001;rs=0.137,P<0.001);但與巨噬細胞、樹突狀細胞和中性粒細胞數量無相關性(rs=–0.008,P>0.05;rs=0.023,P>0.05;rs=0.055,P>0.05),具體見圖 2。該結果提示 CA3 在調節 T 細胞方面發揮一定的作用。本研究進一步分析了 T 細胞亞型標志基因與 CA3 mRNA 表達的關系,結果顯示 CA3 mRNA 表達與 Th2 中的 STAT5A(rs=0.244,P<0.001)、Tfh 中的 BCL6(rs=0.209,P<0.001)和 Th17 中的 STAT3(rs=0.107,P<0.001)標志基因呈正相關,與 T 細胞衰竭標志物例如淋巴細胞活化基因 3(LAG3)、重組人 T 細胞免疫球蛋白黏蛋白 3(TIM-3)和脊髓灰質炎病毒受體相關 2(PVRL2)呈負相關(rs=–0.100,P<0.01;rs=–0.143,P<0.01;rs=–0.082,P<0.05),具體見表 4。


3 討論
隨著醫學的快速發展,生物信息學成為了促進醫學進展的新方法[16]。基于大樣本測序數據,利用生物信息學有利于快速確定腫瘤關鍵治療靶點。乳腺癌目前已經成為全球最高發的惡性腫瘤之一,對女性健康造成巨大的挑戰。因此有必要探索更多的乳腺癌的相關分子靶點,為未來乳腺癌治療提供新方向。
本研究基于 GEPIA2.0 和 TIMER 數據庫資料分析發現,CA3 mRNA 的表達相較于乳腺正常組織,在癌組織中呈低表達;通過 Bc-GenExMinerv4.7 數據庫資料分析,在 ER 陰性、PR 陰性、HER2 陰性和無淋巴轉移乳腺癌中,CA3 mRNA 表達水平較高。Ki67 是一種增殖抗原,有利于腫瘤細胞的生長增殖,可作為乳腺癌預后評估指標[17]。本研究發現,CA3 mRNA 高表達者乳腺癌組織中 Ki67 呈低表達。對乳腺癌患者進行正確的分級有利于最大程度評估患者的預后,選擇合適的治療手段。SBR 分級和 NPI 分級作為目前乳腺癌患者分級的主要手段之一,本研究發現 CA3 mRNA 表達水平隨著 SBR 和 NPI 分級的增高依次降低,提示將來 CA3 mRNA 表達水平或許可以作為相關分級的指標。在正常乳腺樣型中 CA3 mRNA 表達水平最高,Luminal B 型和 HER2 過表達型的 CA3 mRNA 表達水平最低。通過 Kaplan-Meier 繪圖儀數據庫和 Bc-GenExMinerv4.7 數據庫資料分析發現,CA3 mRNA 表達水平低的乳腺癌患者其 OS、RFS 和 DFS 較低,PrognoScan 數據庫在線分析 GEO 多個數據集也發現具有相同趨勢。該初步結果提示,CA3 具有可能作為乳腺癌預后標志物的潛能。
為了進一步了解 CA3 如何參與乳腺癌的發生與發展,本研究通過 LinkedOmics 數據庫,分析了 CA3 共表達基因,并分析了正負相關各前 50 位共表達基因與乳腺癌預后的關系,正相關基因中有 10 個基因與患者預后相關,具有低風險比,P<0.05;負相關基因中有 12 個基因與患者預后相關,具有高風險比,P<0.05。前 3 位的正相關基因 S100B、CA13 和 ALDH1L1 均有學者[18-20]發現其參與抑制乳腺癌的生長。負相關的前 3 位基因中,SEPHS2 在三陰性乳腺癌中過表達,在未來 SEPHS2 相關抑制劑可能是三陰性乳腺癌患者治療的新方向[21];SRXN1 與 SLC9A3R1 均有研究[22-23]表明參與了乳腺癌的發生。這提示 CA3 具有作為乳腺癌預后生物標志物的潛力。
腫瘤細胞的生長依賴腫瘤的發生、生長及轉移,與腫瘤細胞所處的內外環境有著密切的關系[24]。本研究通過 TIMER 數據庫資料分析發現,CA3 mRNA 表達與腫瘤純度和 B 細胞數量呈負相關關系,與 CD4+ T 細胞和 CD8+ T 細胞數量呈正相關關系,提示 CA3 在調控乳腺癌腫瘤微環境方面具有一定的作用。免疫微環境影響著腫瘤的發生發展,CD4+ T 細胞和 CD8+ T 細胞具有抗腫瘤作用[25]。基于腫瘤純度調整后,本研究發現 CA3 mRNA 表達與 Th2(STAT6、STAT5A、IL13)、Tfh(BCL6)和 Th17(STAT3、IL17A)細胞相關標志物正相關關系,與調節性 T 細胞(FOXP3、CCR8、IL2RA)呈負相關關系,與 T 細胞衰竭標志物 PVRL2、LAG3 和 TIM-3 呈負相關關系。免疫檢查點抑制劑是免疫治療的關鍵點,其中的 PD-1 和 CTLA4 已經被批準在臨床上用于腫瘤的治療,LAG3 和 TIM-3 抑制劑在未來惡性腫瘤的免疫治療中具有巨大的潛能[26]。
為了了解 CA3 在乳腺癌中的調控機制,本研究基于 LinkedOmics 數據庫進行 KEGG 基因富集分析,CA3 及其負相關基因涉及的生物學行為包括氧化磷酸化、溶酶體、內質網中的蛋白質加工和蛋白酶體。二甲雙胍是一種氧化磷酸化抑制劑,不僅能用于糖尿病的治療,而且可損壞線粒體功能抑制腫瘤細胞生長,并且通過激活腫瘤抗原特異性細胞毒性 T 淋巴細胞特異性殺傷腫瘤細胞[27-28]。有研究[29]發現,T 細胞衰竭往往表現出更高的糖酵解和受損的線粒體功能,抗氧化劑能夠一定程度上逆轉 T 細胞衰竭。由于 CA3 的特殊結構能夠保護細胞免受氧化應激的傷害,低表達 CA3 可能導致 T 細胞衰竭,發生腫瘤免疫逃逸。干細胞信號轉導通路 Hippo/YAP1、Wnt/β-catenin 和 Hedgehog 在腫瘤干細胞的生長和化療耐藥性方面發揮重要作用。有研究[30]表明,CA3 可減少 YAP1 和 Ki67 在腫瘤干細胞的蛋白表達,從而抑制腫瘤細胞的生長,具體機制尚不清楚。國內有學者[31-32]的研究結果提示,CA3 能夠有效抑制肺癌和結腸癌細胞株的生長。以上研究結果表明 CA3 是乳腺癌的負性調節因子,低表達 CA3 可能通過氧化磷酸化途徑,降低腫瘤免疫力,參與乳腺癌的發生發展。
本研究只是基于目前公共數據庫資料的分析結果,沒有進行體內外實驗驗證;另外,由于 TCGA、GEO 等數據庫樣本數量、質量和統計學方式的變化也可會導致分析結果發生改變。因此有必要進行進一步的驗證。但無論怎樣,本研究通過以上數據庫資料的初步分析結果表明,CA3 有作為乳腺癌潛在標志物的可能。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張江濤負責論文撰寫;阮暉朝負責數據下載與整理;吳向華負責文章審核。