引用本文: 陸思芬, 魏小珍, 牟必琴, 胡瓊霞, 鄧竹君, 張文庚. 基于生物信息數據探究VCAN在食管鱗狀細胞癌預后中的作用. 中國胸心血管外科臨床雜志, 2022, 29(8): 1031-1041. doi: 10.7507/1007-4848.202201072 復制
食管癌是世界上第八大最常見癌癥和第六大癌癥致死原因[1]。食管癌可以分為食管鱗狀細胞癌(esophageal squamous cell carcinoma, ESCC)和食管腺癌(esophageal adenocarcinoma,EAC),其中90%以上都是ESCC [2]。在亞洲,ESCC的發病率一直在顯著上升[3]。ESCC是目前侵襲性最強的鱗狀細胞癌之一,5年生存率低于20% [4],因此,食管癌的早期預后監測對食管癌的治療具有重要意義。然而,盡管這些年在手術、放化療和生物治療等治療方案方面取得了進展,但ESCC的預后仍較差[5]。因此,為ESCC尋找新的治療分子靶點和預后監測生物標志物十分重要。
多功能蛋白聚糖(versican,VCAN),也被稱為CSPG2,是Aggrecan/Versican蛋白多糖家族的一員,它對腫瘤特異性細胞外基質的形成至關重要。VCAN可通過抑制腫瘤壞死因子信號通路介導的細胞凋亡促進腫瘤發生,通過刺激基質金屬蛋白酶表達促進腫瘤的侵襲轉移[6-7]。據研究[8-10]報道,VCAN與胃癌、乳腺癌和白血病等多種腫瘤細胞的增殖和轉移有很強的關聯。總之,VCAN可能與這些腫瘤的預后有關。然而,關于VCAN在ESCC預后中的研究卻較少。
本研究,同時基于RNA芯片數據和RNA高通量測序數據,通過相關的生物信息學軟件和數據庫進行綜合分析,旨在探討VCAN在ESCC預后中的作用,可為臨床醫生對ESCC治療提供初步指導。
1 材料與方法
1.1 數據收集
首先,從GEO數據庫(


1.2 差異表達基因分析
首先,采用XPN算法[16] 調整3個RNA芯片數據集之間可能的批次處理影響,分別合并所有ESCC組織的數據和癌旁正常組織的數據,將批次效應最小化。然后,基于合并后的358個ESCC組織和358個癌旁正常組織的表達量數據(去掉其中的lncRNAs和重復的mRNAs),采用R包“limma” [17]鑒定差異表達基因(differentially expressed genes,DEGs),并設定閾值為 |log2Fold-Change|≥2 和校正 P≤0.050[18]。log2Fold-Change>0 和 log2Fold-Change<0分別定義為上調差異表達基因和下調差異表達基因的閾值。
1.3 蛋白互作網絡和模塊分析
首先,采用數據庫STRING(
1.4 KEGG通路富集分析
采用KOBAS數據庫(
1.5 基因的表達量驗證和生存分析
首先,選擇來自TCGA 和GTEx 數據庫中的RNA高通量測序樣本(包括286個癌旁正常組織和182個 ESCC 組織)的表達量數據驗證被選基因的表達量,然后,采用數據庫Gene Expression Profiling Interactive Analysis(GEPIA,
1.6 VCAN的腫瘤免疫學特性分析
采用數據庫The Tumor Immune Estimation Resource(TIMER,
1.7 構建VCAN和miRNAs的調控網絡
首先,基于TCGA數據庫的182個ESCC 組織和65個癌旁正常組織,采用R包“limma”[17] 分析差異表達的miRNAs(Differentially expressed miRNAs,DEmiRNAs),并設定閾值為:|log2Fold-Change|≥1 和校正 P≤0.050。然后,采用TargetScan(Release 7.2,
1.8 統計學分析
采用軟件 R(版本 4.0.3)進行統計和作圖。選擇乘積極限法(Kaplan-Meier,KM)對生存數據進行計算,選擇對數秩檢驗(log-rank test)做統計分析并計算P值,然后繪制生存曲線。P≤0.050 為差異有統計學意義。
2 結果
2.1 鑒定差異表達基因
首先,整理從GEO數據庫下載到的3個RNA芯片數據集的表達量數據,采用XPN算法調整合并3個數據集,得到358個 ESCC 組織和358個癌旁正常組織的表達量數據,去掉其中的lncRNAs和重復的mRNAs。然后,采用R包“limma”鑒定差異表達基因,并設定閾值為:|log2Fold-Change|≥2 和校正 P≤0.050。共鑒定出630個DEGs(圖1a),包括192個上調DEGs和438個下調差異表達基因,其中VCAN是一個上調差異表達基因。差異表達基因的結果表明ESCC腫瘤組織的基因表達與癌旁正常組織的基因表達明顯不同。

a:差異表達基因的火山圖(基于358個食管鱗狀細胞癌組織和358個癌旁正常組織的表達量數據);b:蛋白互作網絡中的模塊1 [分子復合體識別法(MCODE)score = 14.471,Nodes = 18 ];c:蛋白互作網絡中的模塊2 (MCODE score=13.077,Nodes=14);差異表達基因的閾值為: |log2Fold-Change|≥2 和校正
2.2 差異表達基因的蛋白互作網絡和模塊分析
首先,為了探究這些DEGs之間的交互關系,采用STRING數據庫分析上述630個DEGs的PPI網絡。我們構建出了一個包含629個節點和1 470條邊的PPI網絡。然后,采用MCODE 軟件分析該PPI網絡中的模塊,并選出結果排名最靠前的2個模塊(一共包括32個hub 基因),具體為:模塊1(MCODE score=14.471)包括18個hub 基因,模塊2 (MCODE score=13.077)包括14個hub 基因。這兩個模塊的PPI網絡圖見圖1b~c。
然后,進行這32個hub 基因的KEGG通路富集分析,結果顯示,它們主要富集于蛋白消化吸收、細胞外基質受體相互作用和松弛素信號通路(圖2)。據文獻 [18, 31-32]報道這些通路與癌癥的生存或進展有關,提示這些hub基因可能與ESCC的預后有關。

Qvalue:校正
2.3 差異表達基因的表達量驗證和生存曲線分析
首先,使用TCGA 和 GTEx數據庫中的RNA高通量測序樣本(包括286個癌旁正常組織和182個 ESCC 組織)的表達量數據,驗證上面被挑選出來的32個hub 基因的表達量。結果發現,只有14個基因是差異表達的(P≤0.050),包括BUB1、CEP55、COL1A1、 COL1A2、COL3A1、COL5A1、ELN、LUM、MMP1、SPARC、SPP1、 TOP2A、TPX2 和 VCAN(圖3)。然后,分析這14個基因在ESCC中的生存曲線(圖4),結果發現只有5個基因的表達量越高它們對應的DFS越低,包括COL1A1 (P=0.046)、 COL1A2 (P=0.036)、 SPARC(P=0.023)、SPP1(P=0.001) 和VCAN (P=0.050),而其它基因的生存曲線不存在顯著性結果(P>0.050)。

與286個癌旁正常組織相比,只有 BUB1、CEP55、COL1A1、COL1A2、COL3A1、COL5A1、ELN、LUM、MMP1、SPARC、SPP1、TOP2A、TPX2 和VCAN 在182個 ESCC組織中是顯著高表達的;紅色表示ESCC組織;黑色表示正常組織;顯著差異表達的條件:*

a:COL1A1;b:COL1A2;c:SPARC;d:SPP1 和e:VCAN的高表達與ESCC的預后不良顯著有關(
另外,我們發現在之前的研究中,COL1A1、COL1A2、SPARC和SPP1已經被報道為ESCC的預后標志物 [33-34],所以,本研究只選擇VCAN用于后續的分析,作為ESCC的候選預后標志物。
2.4 VCAN的KEGG通路富集分析
為了探索VCAN可能的分子功能,我們采用KOBAS數據庫進行VCAN的KEGG通路富集分析。結果發現,VCAN可以富集在細胞粘附分子通路(圖1),據文獻[35]報道該通路在調節免疫和腫瘤微環境中發揮重要作用。結果提示VCAN可能與ESCC的免疫環境有關。
2.5 分析VCAN在ESCC免疫環境中的作用
為了探索VCAN在ESCC免疫環境中的潛在作用,我們用TIMER數據庫分析VCAN與ESCC TIICs 之間的關系,因為有報道稱部分TIICs與ESCC的預后不良有關[36-37]。結果發現(圖5a),VCAN與ESCC中的巨噬細胞(macrophages)浸潤水平呈現正相關(R=0.576,P<0.001), 而與其它的免疫細胞相關性很小,包括腫瘤純度、B 細胞、CD4+ T細胞、CD8+ T細胞、中性粒細胞和樹突狀細胞(R<0.300, P>0.050),因為相關系數小于0.300被認為是可以忽略的相關[38]。因此,我們只重點關注VCAN與巨噬細胞的相關性。而且,據文獻[39]報道,巨噬細胞有兩種不同的表型,包括抑制腫瘤的M1表型和支持腫瘤的M2表型。Nitric oxide synthase 2 (NOS2)、 interferon regulatory factor 5(IRF5)和prostaglandin-endoperoxide synthase 2(PTGS2)是M1的基因標志物,而CD163 molecule(CD163)、V-set and immunoglobulin domain–containing 4 (VSIG4) 和membrane spanning 4-domains A4A (MS4A4A)是M2的基因標志物。我們分析了VCAN和這些基因標志物之間的關系。結果發現,VCAN的表達量與CD163 (R=0.481,P<0.001),VSIG4(R=0.526,P<0.001),MS4A4A(R= 0.520,P<0.001)的豐度呈現顯著正相關的關系,它們均為M2巨噬細胞的標志物(圖5b);而VCAN與NOS2、IRF5和PTGS2豐度的相關性可以忽略不計(R<0.300),這些都是M1巨噬細胞的標志物(圖5c)。而且,腫瘤相關巨噬細胞(tumor-associated mecrophages TAMs)可以分化為M2表型,并促進疾病的進展,有文獻[37]稱浸潤性CD204+ TAMs的升高與ESCC的預后不良相關。因此,我們也分析了VCAN與CD204豐度的相關性,結果發現,VCAN的豐度與CD204的豐度呈現正相關(圖5d, R=0.621, P<0.001)。這些結果提示VCAN確實可以在ESCC的免疫環境中發揮作用,主要表現為VCAN的表達量與M2巨噬細胞及其基因標志物的豐度顯著正相關。

a:VCAN的豐度與B 細胞、CD4+ T細胞、CD8+ T細胞、中性粒細胞、巨噬細胞和樹突狀細胞之間的Spearman相關性分析圖;VCAN的豐度和巨噬細胞的基因標志物的豐度之間的關系;b:M2的基因標志物;c:M1的基因標志物;d:與TAMs有關的CD204;TIICs:腫瘤浸潤性免疫細胞;TAMs:腫瘤相關巨噬細胞;相關性顯著的閾值為
2.6 構建ESCC中VCAN與miRNAs的調控網絡
接下來,我們評估了ESCC中VCAN與miRNAs相互作用的潛力,因為有一些miRNAs與ESCC的發展和進展相關,例如has-miR-135b-5p[40]。首先,使用TCGA-ESCC隊列中的182個ESCC樣本和65個正常樣本的miRNAs數據鑒定出64個上調差異表達和21個下調差異表達的DEmiRNAs(圖6a)。然后,基于ESCC中的miRNAs數據,采用Targetscan軟件預測出24個能夠靶向VCAN的miRNAs (圖6b),同時采用miRDB軟件預測出74個能夠靶向VCAN的miRNAs(圖6b),取交集后得到15個miRNAs(圖6b)。這15個miRNAs用于構建miRNAs和VCAN的調控網絡(圖6c),其中hsa-mir-135b 是ESCC中的上調差異表達DEmiRNA。這些結果表明VCAN可以與ESCC中的miRNAs相互作用,其中有些miRNAs與ESCC的預后有關。

a:食管鱗狀細胞癌中的上調差異表達和下調差異表達miRNAs;b:Targetscan和miRDB軟件預測得到的能夠靶向VCAN的miRNAs;c:食管鱗狀細胞癌中VCAN和miRNAs的調控網絡,其中has-mir-135b可能與食管鱗狀細胞癌的進展相關
3 討論
由于ESCC的高發病率和低生存率,尋找新的預后標志物和有效靶點是迫切需要的[10]。VCAN已被報道與幾種腫瘤的預后有關[8-10],然而VCAN在ESCC預后中的作用尚未見明確報道。本研究基于3個RNA芯片數據集的358個 ESCC 組織和358個癌旁正常組織的表達量數據,鑒定出630個DEGs和32個hub基因,然后使用182個 ESCC 組織和286個癌旁正常組織的RNA高通量測序的表達量數據對這32個hub基因的表達量進行驗證,結果發現只有14個hub基因差異表達,這14個基因的生存曲線分析結果顯示,只有COL1A1、COL1A2、SPARC、SPP1 和 VCAN 跟ESCC的預后顯著相關,直接提示VCAN在ESCC預后中的作用。有趣的是,我們通過綜合分析發現,VCAN的豐度與M2巨噬細胞及其基因標志物的豐度顯著正相關,其中有一些M2巨噬細胞的基因標志物與ESCC的預后相關;并且VCAN可以被 ESCC中的miRNAs調控,其中有一些miRNAs與ESCC的進展相關,這些結果間接提示VCAN在ESCC預后中的作用。
本研究的結果表明,與癌旁正常組織相比,VCAN在ESCC組織中明顯高表達,且VCAN的高表達可以導致ESCC的DFS顯著縮短,直接提示VCAN在ESCC預后中的作用。這些結果與之前關于VCAN在ESCC組織間質細胞中高表達的研究基本一致,主要原因為VCAN與侵襲、淋巴結轉移、淋巴管及靜脈浸潤陽性密切相關[41]。
KEGG通路富集分析結果表明VCAN在Cell adhesion molecules中富集,而且據文獻[35]報道該通路可以在調節免疫和腫瘤微環境中發揮關鍵作用,這提示VCAN可能與ESCC的免疫環境有關。同時,以往研究[36-37]已經認識到一些免疫相關的TIICs在預測ESCC不良預后方面的關鍵作用,因此,我們分析VCAN與TIICs之間的關系,以間接考察VCAN對ESCC預后的影響。結果發現,VCAN的豐度與M2巨噬細胞的豐度顯著正相關,而與其它TIICs細胞(B 細胞、CD4+ T細胞、CD8+ T細胞、中性粒細胞和樹突狀細胞)相關性不大;同時VCAN的表達與CD163和CD204的表達顯著正相關。據文獻[42]報道,在腫瘤組織中,巨噬細胞可表現為M1表型和M2表型,M2表型占70%以上;M1表型是腫瘤抑制型,而M2表型是腫瘤支持型,與癌癥的預后不良有關。另外,據文獻[36]報道,CD163+ M2的高密度可能是ESCC的獨立預后不良因素。此外,TAMs可以分化為M2表型,并促進疾病的進展,且有報道[37]稱浸潤性CD204+ TAMs的增加與ESCC的預后不良相關。因此,從這個角度來看,VCAN的高表達可能與ESCC的預后不良有關。據我們所知,本研究通過結合VCAN和TIICs之間的關系來探討VCAN在ESCC預后中的價值,為VCAN的首次相關研究。
最后,VCAN可被ESCC中的miRNAs調控,包括hsa-mir-135b;而且據文獻[40]報道,has-miR-135b-5p與ESCC的總生存時間相關。miRNAs的特定功能是通過互補序列抑制翻譯或促進相應靶標mRNA的降解來發揮[40];因此,VCAN的表達量變化可能與has-miR-135b-5p的表達量變化有關,而has-miR-135b-5p與ESCC的進展有關,間接暗示VCAN與ESCC的預后有關。雖然更詳細的機制還有待進一步闡明,但本研究結果表明,VCAN可能通過參與miRNAs有關的調控,在ESCC的進展中發揮作用。
但是,本研究存在一個不足之處,本研究中的生物信息學分析結果需要在未來的生物實驗中得到證實。未來我們將進一步探討VCAN在ESCC進展中的潛在分子機制。
綜上所述,本研究共鑒定出630個DEGs和32個hub基因,其中VCAN是一個上調差異表達基因。高表達的VCAN與ESCC的預后不良有關。
利益沖突:無。
作者貢獻:張文庚為負責人,負責指導研究;陸思芬和魏小珍共同負責整體研究設計,具體實施研究,分析數據并匯總,撰寫論文;牟必琴參與研究實施,負責數據收集和下載;胡瓊霞和鄧竹君參與研究實施,負責文獻下載和整理;全體作者參與文章撰寫及文章審閱。
食管癌是世界上第八大最常見癌癥和第六大癌癥致死原因[1]。食管癌可以分為食管鱗狀細胞癌(esophageal squamous cell carcinoma, ESCC)和食管腺癌(esophageal adenocarcinoma,EAC),其中90%以上都是ESCC [2]。在亞洲,ESCC的發病率一直在顯著上升[3]。ESCC是目前侵襲性最強的鱗狀細胞癌之一,5年生存率低于20% [4],因此,食管癌的早期預后監測對食管癌的治療具有重要意義。然而,盡管這些年在手術、放化療和生物治療等治療方案方面取得了進展,但ESCC的預后仍較差[5]。因此,為ESCC尋找新的治療分子靶點和預后監測生物標志物十分重要。
多功能蛋白聚糖(versican,VCAN),也被稱為CSPG2,是Aggrecan/Versican蛋白多糖家族的一員,它對腫瘤特異性細胞外基質的形成至關重要。VCAN可通過抑制腫瘤壞死因子信號通路介導的細胞凋亡促進腫瘤發生,通過刺激基質金屬蛋白酶表達促進腫瘤的侵襲轉移[6-7]。據研究[8-10]報道,VCAN與胃癌、乳腺癌和白血病等多種腫瘤細胞的增殖和轉移有很強的關聯。總之,VCAN可能與這些腫瘤的預后有關。然而,關于VCAN在ESCC預后中的研究卻較少。
本研究,同時基于RNA芯片數據和RNA高通量測序數據,通過相關的生物信息學軟件和數據庫進行綜合分析,旨在探討VCAN在ESCC預后中的作用,可為臨床醫生對ESCC治療提供初步指導。
1 材料與方法
1.1 數據收集
首先,從GEO數據庫(


1.2 差異表達基因分析
首先,采用XPN算法[16] 調整3個RNA芯片數據集之間可能的批次處理影響,分別合并所有ESCC組織的數據和癌旁正常組織的數據,將批次效應最小化。然后,基于合并后的358個ESCC組織和358個癌旁正常組織的表達量數據(去掉其中的lncRNAs和重復的mRNAs),采用R包“limma” [17]鑒定差異表達基因(differentially expressed genes,DEGs),并設定閾值為 |log2Fold-Change|≥2 和校正 P≤0.050[18]。log2Fold-Change>0 和 log2Fold-Change<0分別定義為上調差異表達基因和下調差異表達基因的閾值。
1.3 蛋白互作網絡和模塊分析
首先,采用數據庫STRING(
1.4 KEGG通路富集分析
采用KOBAS數據庫(
1.5 基因的表達量驗證和生存分析
首先,選擇來自TCGA 和GTEx 數據庫中的RNA高通量測序樣本(包括286個癌旁正常組織和182個 ESCC 組織)的表達量數據驗證被選基因的表達量,然后,采用數據庫Gene Expression Profiling Interactive Analysis(GEPIA,
1.6 VCAN的腫瘤免疫學特性分析
采用數據庫The Tumor Immune Estimation Resource(TIMER,
1.7 構建VCAN和miRNAs的調控網絡
首先,基于TCGA數據庫的182個ESCC 組織和65個癌旁正常組織,采用R包“limma”[17] 分析差異表達的miRNAs(Differentially expressed miRNAs,DEmiRNAs),并設定閾值為:|log2Fold-Change|≥1 和校正 P≤0.050。然后,采用TargetScan(Release 7.2,
1.8 統計學分析
采用軟件 R(版本 4.0.3)進行統計和作圖。選擇乘積極限法(Kaplan-Meier,KM)對生存數據進行計算,選擇對數秩檢驗(log-rank test)做統計分析并計算P值,然后繪制生存曲線。P≤0.050 為差異有統計學意義。
2 結果
2.1 鑒定差異表達基因
首先,整理從GEO數據庫下載到的3個RNA芯片數據集的表達量數據,采用XPN算法調整合并3個數據集,得到358個 ESCC 組織和358個癌旁正常組織的表達量數據,去掉其中的lncRNAs和重復的mRNAs。然后,采用R包“limma”鑒定差異表達基因,并設定閾值為:|log2Fold-Change|≥2 和校正 P≤0.050。共鑒定出630個DEGs(圖1a),包括192個上調DEGs和438個下調差異表達基因,其中VCAN是一個上調差異表達基因。差異表達基因的結果表明ESCC腫瘤組織的基因表達與癌旁正常組織的基因表達明顯不同。

a:差異表達基因的火山圖(基于358個食管鱗狀細胞癌組織和358個癌旁正常組織的表達量數據);b:蛋白互作網絡中的模塊1 [分子復合體識別法(MCODE)score = 14.471,Nodes = 18 ];c:蛋白互作網絡中的模塊2 (MCODE score=13.077,Nodes=14);差異表達基因的閾值為: |log2Fold-Change|≥2 和校正
2.2 差異表達基因的蛋白互作網絡和模塊分析
首先,為了探究這些DEGs之間的交互關系,采用STRING數據庫分析上述630個DEGs的PPI網絡。我們構建出了一個包含629個節點和1 470條邊的PPI網絡。然后,采用MCODE 軟件分析該PPI網絡中的模塊,并選出結果排名最靠前的2個模塊(一共包括32個hub 基因),具體為:模塊1(MCODE score=14.471)包括18個hub 基因,模塊2 (MCODE score=13.077)包括14個hub 基因。這兩個模塊的PPI網絡圖見圖1b~c。
然后,進行這32個hub 基因的KEGG通路富集分析,結果顯示,它們主要富集于蛋白消化吸收、細胞外基質受體相互作用和松弛素信號通路(圖2)。據文獻 [18, 31-32]報道這些通路與癌癥的生存或進展有關,提示這些hub基因可能與ESCC的預后有關。

Qvalue:校正
2.3 差異表達基因的表達量驗證和生存曲線分析
首先,使用TCGA 和 GTEx數據庫中的RNA高通量測序樣本(包括286個癌旁正常組織和182個 ESCC 組織)的表達量數據,驗證上面被挑選出來的32個hub 基因的表達量。結果發現,只有14個基因是差異表達的(P≤0.050),包括BUB1、CEP55、COL1A1、 COL1A2、COL3A1、COL5A1、ELN、LUM、MMP1、SPARC、SPP1、 TOP2A、TPX2 和 VCAN(圖3)。然后,分析這14個基因在ESCC中的生存曲線(圖4),結果發現只有5個基因的表達量越高它們對應的DFS越低,包括COL1A1 (P=0.046)、 COL1A2 (P=0.036)、 SPARC(P=0.023)、SPP1(P=0.001) 和VCAN (P=0.050),而其它基因的生存曲線不存在顯著性結果(P>0.050)。

與286個癌旁正常組織相比,只有 BUB1、CEP55、COL1A1、COL1A2、COL3A1、COL5A1、ELN、LUM、MMP1、SPARC、SPP1、TOP2A、TPX2 和VCAN 在182個 ESCC組織中是顯著高表達的;紅色表示ESCC組織;黑色表示正常組織;顯著差異表達的條件:*

a:COL1A1;b:COL1A2;c:SPARC;d:SPP1 和e:VCAN的高表達與ESCC的預后不良顯著有關(
另外,我們發現在之前的研究中,COL1A1、COL1A2、SPARC和SPP1已經被報道為ESCC的預后標志物 [33-34],所以,本研究只選擇VCAN用于后續的分析,作為ESCC的候選預后標志物。
2.4 VCAN的KEGG通路富集分析
為了探索VCAN可能的分子功能,我們采用KOBAS數據庫進行VCAN的KEGG通路富集分析。結果發現,VCAN可以富集在細胞粘附分子通路(圖1),據文獻[35]報道該通路在調節免疫和腫瘤微環境中發揮重要作用。結果提示VCAN可能與ESCC的免疫環境有關。
2.5 分析VCAN在ESCC免疫環境中的作用
為了探索VCAN在ESCC免疫環境中的潛在作用,我們用TIMER數據庫分析VCAN與ESCC TIICs 之間的關系,因為有報道稱部分TIICs與ESCC的預后不良有關[36-37]。結果發現(圖5a),VCAN與ESCC中的巨噬細胞(macrophages)浸潤水平呈現正相關(R=0.576,P<0.001), 而與其它的免疫細胞相關性很小,包括腫瘤純度、B 細胞、CD4+ T細胞、CD8+ T細胞、中性粒細胞和樹突狀細胞(R<0.300, P>0.050),因為相關系數小于0.300被認為是可以忽略的相關[38]。因此,我們只重點關注VCAN與巨噬細胞的相關性。而且,據文獻[39]報道,巨噬細胞有兩種不同的表型,包括抑制腫瘤的M1表型和支持腫瘤的M2表型。Nitric oxide synthase 2 (NOS2)、 interferon regulatory factor 5(IRF5)和prostaglandin-endoperoxide synthase 2(PTGS2)是M1的基因標志物,而CD163 molecule(CD163)、V-set and immunoglobulin domain–containing 4 (VSIG4) 和membrane spanning 4-domains A4A (MS4A4A)是M2的基因標志物。我們分析了VCAN和這些基因標志物之間的關系。結果發現,VCAN的表達量與CD163 (R=0.481,P<0.001),VSIG4(R=0.526,P<0.001),MS4A4A(R= 0.520,P<0.001)的豐度呈現顯著正相關的關系,它們均為M2巨噬細胞的標志物(圖5b);而VCAN與NOS2、IRF5和PTGS2豐度的相關性可以忽略不計(R<0.300),這些都是M1巨噬細胞的標志物(圖5c)。而且,腫瘤相關巨噬細胞(tumor-associated mecrophages TAMs)可以分化為M2表型,并促進疾病的進展,有文獻[37]稱浸潤性CD204+ TAMs的升高與ESCC的預后不良相關。因此,我們也分析了VCAN與CD204豐度的相關性,結果發現,VCAN的豐度與CD204的豐度呈現正相關(圖5d, R=0.621, P<0.001)。這些結果提示VCAN確實可以在ESCC的免疫環境中發揮作用,主要表現為VCAN的表達量與M2巨噬細胞及其基因標志物的豐度顯著正相關。

a:VCAN的豐度與B 細胞、CD4+ T細胞、CD8+ T細胞、中性粒細胞、巨噬細胞和樹突狀細胞之間的Spearman相關性分析圖;VCAN的豐度和巨噬細胞的基因標志物的豐度之間的關系;b:M2的基因標志物;c:M1的基因標志物;d:與TAMs有關的CD204;TIICs:腫瘤浸潤性免疫細胞;TAMs:腫瘤相關巨噬細胞;相關性顯著的閾值為
2.6 構建ESCC中VCAN與miRNAs的調控網絡
接下來,我們評估了ESCC中VCAN與miRNAs相互作用的潛力,因為有一些miRNAs與ESCC的發展和進展相關,例如has-miR-135b-5p[40]。首先,使用TCGA-ESCC隊列中的182個ESCC樣本和65個正常樣本的miRNAs數據鑒定出64個上調差異表達和21個下調差異表達的DEmiRNAs(圖6a)。然后,基于ESCC中的miRNAs數據,采用Targetscan軟件預測出24個能夠靶向VCAN的miRNAs (圖6b),同時采用miRDB軟件預測出74個能夠靶向VCAN的miRNAs(圖6b),取交集后得到15個miRNAs(圖6b)。這15個miRNAs用于構建miRNAs和VCAN的調控網絡(圖6c),其中hsa-mir-135b 是ESCC中的上調差異表達DEmiRNA。這些結果表明VCAN可以與ESCC中的miRNAs相互作用,其中有些miRNAs與ESCC的預后有關。

a:食管鱗狀細胞癌中的上調差異表達和下調差異表達miRNAs;b:Targetscan和miRDB軟件預測得到的能夠靶向VCAN的miRNAs;c:食管鱗狀細胞癌中VCAN和miRNAs的調控網絡,其中has-mir-135b可能與食管鱗狀細胞癌的進展相關
3 討論
由于ESCC的高發病率和低生存率,尋找新的預后標志物和有效靶點是迫切需要的[10]。VCAN已被報道與幾種腫瘤的預后有關[8-10],然而VCAN在ESCC預后中的作用尚未見明確報道。本研究基于3個RNA芯片數據集的358個 ESCC 組織和358個癌旁正常組織的表達量數據,鑒定出630個DEGs和32個hub基因,然后使用182個 ESCC 組織和286個癌旁正常組織的RNA高通量測序的表達量數據對這32個hub基因的表達量進行驗證,結果發現只有14個hub基因差異表達,這14個基因的生存曲線分析結果顯示,只有COL1A1、COL1A2、SPARC、SPP1 和 VCAN 跟ESCC的預后顯著相關,直接提示VCAN在ESCC預后中的作用。有趣的是,我們通過綜合分析發現,VCAN的豐度與M2巨噬細胞及其基因標志物的豐度顯著正相關,其中有一些M2巨噬細胞的基因標志物與ESCC的預后相關;并且VCAN可以被 ESCC中的miRNAs調控,其中有一些miRNAs與ESCC的進展相關,這些結果間接提示VCAN在ESCC預后中的作用。
本研究的結果表明,與癌旁正常組織相比,VCAN在ESCC組織中明顯高表達,且VCAN的高表達可以導致ESCC的DFS顯著縮短,直接提示VCAN在ESCC預后中的作用。這些結果與之前關于VCAN在ESCC組織間質細胞中高表達的研究基本一致,主要原因為VCAN與侵襲、淋巴結轉移、淋巴管及靜脈浸潤陽性密切相關[41]。
KEGG通路富集分析結果表明VCAN在Cell adhesion molecules中富集,而且據文獻[35]報道該通路可以在調節免疫和腫瘤微環境中發揮關鍵作用,這提示VCAN可能與ESCC的免疫環境有關。同時,以往研究[36-37]已經認識到一些免疫相關的TIICs在預測ESCC不良預后方面的關鍵作用,因此,我們分析VCAN與TIICs之間的關系,以間接考察VCAN對ESCC預后的影響。結果發現,VCAN的豐度與M2巨噬細胞的豐度顯著正相關,而與其它TIICs細胞(B 細胞、CD4+ T細胞、CD8+ T細胞、中性粒細胞和樹突狀細胞)相關性不大;同時VCAN的表達與CD163和CD204的表達顯著正相關。據文獻[42]報道,在腫瘤組織中,巨噬細胞可表現為M1表型和M2表型,M2表型占70%以上;M1表型是腫瘤抑制型,而M2表型是腫瘤支持型,與癌癥的預后不良有關。另外,據文獻[36]報道,CD163+ M2的高密度可能是ESCC的獨立預后不良因素。此外,TAMs可以分化為M2表型,并促進疾病的進展,且有報道[37]稱浸潤性CD204+ TAMs的增加與ESCC的預后不良相關。因此,從這個角度來看,VCAN的高表達可能與ESCC的預后不良有關。據我們所知,本研究通過結合VCAN和TIICs之間的關系來探討VCAN在ESCC預后中的價值,為VCAN的首次相關研究。
最后,VCAN可被ESCC中的miRNAs調控,包括hsa-mir-135b;而且據文獻[40]報道,has-miR-135b-5p與ESCC的總生存時間相關。miRNAs的特定功能是通過互補序列抑制翻譯或促進相應靶標mRNA的降解來發揮[40];因此,VCAN的表達量變化可能與has-miR-135b-5p的表達量變化有關,而has-miR-135b-5p與ESCC的進展有關,間接暗示VCAN與ESCC的預后有關。雖然更詳細的機制還有待進一步闡明,但本研究結果表明,VCAN可能通過參與miRNAs有關的調控,在ESCC的進展中發揮作用。
但是,本研究存在一個不足之處,本研究中的生物信息學分析結果需要在未來的生物實驗中得到證實。未來我們將進一步探討VCAN在ESCC進展中的潛在分子機制。
綜上所述,本研究共鑒定出630個DEGs和32個hub基因,其中VCAN是一個上調差異表達基因。高表達的VCAN與ESCC的預后不良有關。
利益沖突:無。
作者貢獻:張文庚為負責人,負責指導研究;陸思芬和魏小珍共同負責整體研究設計,具體實施研究,分析數據并匯總,撰寫論文;牟必琴參與研究實施,負責數據收集和下載;胡瓊霞和鄧竹君參與研究實施,負責文獻下載和整理;全體作者參與文章撰寫及文章審閱。