引用本文: 潘世澤, 李寧, 宋從寬, 郝博, 盧子龍, 范濤, 李東航, 張霖, 孟恒, 賴凱, 耿慶. 基于GEO數據庫與生物信息學方法分析食管鱗狀細胞癌中的免疫微環境和潛在敏感藥物. 中國胸心血管外科臨床雜志, 2023, 30(9): 1251-1260. doi: 10.7507/1007-4848.202110062 復制
食管癌是全球第8大最常見癌癥,癌癥死亡率占第6[1]。食管癌有兩種主要的組織學類型:腺癌和鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC),其病因、發病機制和生物學特征不同。食管癌發病率在西方國家逐年上升,其在亞洲國家仍占主導地位[2]。此外,ESCC的總體5年生存率仍然極差,復發和轉移概率較高[3]。盡管TNM分期已被廣泛用作預后因素,但由于ESCC的異質性,同一臨床階段患者的生存有很大差異。因此,迫切需要一個強大的預后生物標志物來對食管癌高風險患者進行臨床識別。
近年來,對免疫檢查點抑制劑[如程序性死亡受體-1(programmed cell death-1,PD-1)/程序性死亡受體-1配體(programmed cell death-1 ligand,PD-L1)抑制劑、細胞毒性T細胞抗原4(cytotoxic T lymphocyte-associated antigen 4,CTLA-4)抑制劑等]的研究,在ESCC中顯示出了有希望的結果。此外,免疫檢查點抑制劑和傳統的抗腫瘤策略聯合治療ESCC已經引起了研究者的廣泛興趣,結果令人鼓舞[4]。然而,由于耐藥性,只有少數患者獲得了臨床效益[5]。因此,在臨床實踐中,若能找到準確的預測標志物,并針對不同風險食管癌給予相應的敏感藥物,將有助于患者的個性化治療。
越來越多的證據[6]表明,腫瘤細胞內在因素(如PD-L1表達、腫瘤突變負荷和微衛星不穩定性高狀態)與免疫檢查點抑制劑的療效相關。此外,腫瘤對免疫治療的耐藥性可能由腫瘤浸潤淋巴細胞(tumor infiltrating lymphocytes,TILs)、腫瘤相關巨噬細胞(tumor-associated macrophages,TAMs)等巨噬細胞和骨髓來源的抑制細胞(myeloid-derived suppressor cells,MDSC)引起[7-9]。因此,更好地探索不同ESCC患者的腫瘤微環境(tumor microenvironment,TME),如腫瘤PD-L1的表達、TILs、TAMs和MDSCs,變得越來越重要。
在本研究中,我們探討了免疫檢查點基因的預后意義,并開發了新的基于3個免疫檢查點基因特征的風險評分來預測ESCC的預后。研究不同風險分組的免疫細胞浸潤情況、TME和藥物敏感性,為不同風險食管癌患者尋找新的潛在免疫檢查點和敏感藥物提供一種參考。
1 資料與方法
1.1 RNA測序數據資料和臨床數據
收集基因表達綜合數據庫(GEO)GSE53625數據集中ESCC樣本及其對應的癌旁正常組織樣本,提取免疫檢查點基因轉錄組測序數據和臨床資料。
1.2 方法
1.2.1 候選基因的鑒別
基于GSE53625數據集,利用“limma”R包識別出食管癌和正常組織之間的差異表達基因,臨界值為|log2FC|>0和FDR<0.05(FC:fold change,倍數變化;FDR:false discovery rate,錯誤發現率)。對這些差異表達基因進行單因素Cox分析,差異有統計學意義(P≤0.05)的基因被認為與預后相關。
1.2.2 與差異表達基因相關的藥物敏感性分析
從CellMiner(
1.2.3 風險模型的建立
與預后相關的基因被擬合到最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析中(使用“glmnet”R包),以降低數據的維數。使用“survival”R包進行多因素Cox分析,計算每個基因的系數。根據以下公式生成風險評分:風險評分=β1×G1+β2×G2......+βn×Gn,其中βn代表基因的系數,Gn為基因的表達水平。根據風險評分的中位值,將患者分為高、低風險組,驗證風險模型的分層能力。
1.2.4 對TME和免疫景觀的估計
為了描述ESCC免疫景觀,本研究應用ssGSEA分析[10]用于量化TME中各種免疫細胞的浸潤豐度和免疫通路。使用ESTIMATE算法[11]估計惡性腫瘤中基質和免疫細胞含量,并推斷腫瘤純度、計算免疫和基質評分。免疫評分高、腫瘤純度低,說明腫瘤組織中免疫細胞和基質細胞含量豐富。
1.2.5 不同風險組的藥物敏感性
半抑制濃度是評估藥物療效或樣本治療反應的重要指標。基于樣本轉錄組,我們使用“pRp”R包[12]評估每個樣本的半抑制濃度,以比較不同風險亞組的藥物敏感性。半抑制濃度值越高,藥物敏感性就越低。
1.3 統計學分析
采用Kaplan-Meier方法評價高低風險組之間的總生存期(overall survival,OS),采用log-rank方法驗證顯著性差異。采用t檢驗分析不同風險組的免疫細胞分布、免疫通路、TME和藥物敏感性。采用Cox比例風險回歸模型計算獨立預后因素。在所有的分析方法中,P≤0.05為差異有統計學意義。使用R4.0.1(
2 結果
2.1 一般資料
共收集GSE53625 數據集中的358 個樣本,囊括了 89 383 個全基因組和非編碼 RNA 信息,包含來自 179 例患者的 ESCC 樣本及其癌旁組織樣本,其中男 33 例、女 146 例,≤60 歲 80 例,>60 歲 99 例;見表1。

2.2 篩選差異基因和差異基因藥物敏感性
基于GSE53625數據集的樣本數據,首先對免疫檢查點基因數據集進行標準化處理,然后繪制熱圖并展示不同免疫檢查點基因在ESCC組和ESCC癌旁組中的表達情況;見圖1a。篩選39個差異表達的免疫檢查點基因,其中包括14個低表達基因(CD200R1、CD40LG、BTLA、VSIR、CD160、ICOSLG、CD70、IDO2、CD200、TMIGD2、TNFSF14、CD244、LGALS9、CD48),25個高表達基因(CD44、HAVCR2、HHLA2、TNFRSF25、NRP1、CD274、TIGIT、KIR3DL1、VTCN1、TNFSF9、TNFSF18、LAIR1、ICOS、LAG3、CD86、PDCD1LG2、TNFRSF9、TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1、CD80、TNFRSF18)(log2FC>0和FDR<0.05);見圖1b。其中8個基因(TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1、CD80、TNFRSF18)在食管癌中顯著高表達(log2FC>1和FDR<0.05),探索針對這8個基因的敏感藥物,發現多個化合物與這些基因顯著相關(P<0.05);見圖1c。

a:所有免疫檢查點基因表達特征熱圖(藍色:低表達,紅色:高表達);b:腫瘤和正常組織中差異表達基因;c:顯著高表達的免疫檢查點基因與藥物Z評分相關性(藍色:負相關,紅色:正相關,線條粗細代表相關性強弱)
2.3 候選基因篩選和模型構建
單因素Cox分析篩選出3個預后相關基因[NRP1:HR=1.484(1.026,2.144),P=0.036;ICOSLG:HR=1.265(1.001,1.599),P=0.049;HHLA2:HR=0.666(0.504,0.881),P=0.004]。將這3個候選基因進行LASSO回歸分析,進行100次交叉驗證以避免過度擬合,然后將這3個候選基因繼續多因素Cox分析(逐步回歸法);見圖2a~b。最后,基于這3個基因[進行log2(FPKM+1)標準化]構建ESCC風險模型,風險評分=(0.25344×NRP1)+(0.2314×ICOSLG)+(?0.3181×HHLA2),并根據風險評分中位值將樣本分為高低風險組。其中,高風險組有較高比例的死亡樣本,而低風險組存活的人數較多;見圖2c~d。主成分分析和t-分布領域嵌入算法分析顯示,根據風險評分可以很好地將ESCC分為兩類,這說明基于3個免疫檢查點基因的風險模型具有很好的分層能力;見圖2e~f。這在生存分析中得到了充分驗證,高風險組的生存率顯著低于低風險組(P<0.001);見圖2g。此外,單因素和多因素Cox分析顯示,3個免疫檢查點基因的風險評分是ESCC的獨立預后因素(P=0.001);見圖2h~i。

a:3個候選基因的LASSO回歸特征譜;b:在LASSO模型中對候選基因參數進行100倍交叉驗證;c~d:風險評分和生存狀態的分布;e~f:基于風險評分的主成分分析和
2.4 不同ESCC亞型分析
為了驗證風險評分的分層能力,我們進一步對不同食管癌亞型進行Kaplan-Meier分析,結果發現對不同性別、年齡、T分期和N分期、腫瘤部位和是否吸煙患者,基于3個免疫檢查點基因的模型均有較強的分層能力,低風險組的OS顯著長于高風險組(P<0.05)。在無吸煙史的病例中,我們觀察到預測模型不能將病例很好地區分開來(P=0.306),這可能與納入的病例數較少有關;見圖3。

a~b:不同年齡的OS生存曲線;c~d:不同性別的OS生存曲線;e~f:不同T分期的OS生存曲線;g~h:不同N分期的OS生存曲線;i~k:不同腫瘤部位的OS生存曲線;l~n:不同腫瘤分化的OS生存曲線;o~p:不同吸煙史的OS生存曲線;OS:總生存期
2.5 不同風險分組的通路差異富集
為了識別不同風險亞組之間的生物學行為,我們進行了Metascape分析[13]。首先獲得高低風險分組之間2 697個差異表達的基因。其中1 551個基因在高風險組中高表達,Metascape分析結果顯示,這些基因在高風險組主要參與細胞激活調控、免疫調節、NABA核心基質、樹突細胞分化和自然殺傷細胞趨化等通路;見圖4a。而1 146個基因在低風險組中高表達,這些基因在低風險組主要富集于內肽酶活性負性調控、NABA基質相關(典型途徑)、脂肪酸代謝和糖攝入等通路中;見圖4b。

a:高風險組的通路富集;b:低風險組的通路富集
2.6 不同風險組的TME和藥物敏感性
使用ssGSEA[10]分析了每個樣本中16種免疫細胞的浸潤豐度和13種免疫相關通路,結果發現相對于低風險組,高風險組中富集較高比例的B細胞、DC細胞、CD8+T細胞、Th2細胞和TILs細胞(P<0.05);見圖5a。并且在多個免疫通路中高度富集,比如抗原呈遞細胞共刺激、免疫檢查點、細胞溶解激活、人類白細胞抗原系統、促炎和T細胞共刺激或共抑制等通路(P<0.05);見圖5b。比較不同分組中免疫檢查點基因表達情況,發現多個基因在高風險組中富集(CD40LG、BTLA、ICOSLG、IDO2、TMIGD2、TNFSF14、CD244、LGALS9、CD48、TNFSF15、CD28、CD40、ADORA2A、PDCD1、HAVCR2、CD27、TNFRSF25、NRP1、TIGIT、TNFSF9、LAIR1、ICOS、LAG3、CD86、TNFRSF9、TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1),只有HHLA2和KIR3DL1在低風險組中富集,而PD-L1(CD274)在高低風險組中未見差異表達;見圖5c。使用ESTIMATE算法[11]評估每個樣本中的TME,發現高風險組具有較高的基質評分、免疫評分,而低風險組中腫瘤純度顯著高于高風險組(P<0.05);圖5d~g。幾種常用藥物(硼替佐米、帕唑帕尼、阿糖胞苷、伏立諾他、長春新堿、伊利司莫、吉西他濱、索拉非尼、博來霉素、替吡法尼、阿霉素、依托泊苷)在高風險組中有較低半抑制濃度,這表明高風險組患者對這些藥物的敏感性可能較高;見圖6。

a:不同風險組的免疫細胞浸潤;b:不同風險組的免疫相關通路;c:不同風險組中免疫檢查點基因表達;d:不同風險組的基質評分;e:不同風險組的免疫評分;f:不同風險組的綜合評分;g:不同風險組的腫瘤純度

3 討論
ESCC是一種高度惡性的腫瘤,手術聯合放療、化療和靶向治療是目前ESCC的主要治療方法。然而,由于高復發率和轉移率,食管癌的生存結果仍不滿意[14-16]。雖然涉及食管癌的相關免疫治療仍處于初步研究階段,但一些相關抑制劑已進入臨床試驗,顯示出持久的抗腫瘤活性和可控的不良反應,提示ESCC的免疫微環境和免疫檢查靶點值得進一步探索[1]。抗PD-L1的帕博利珠單抗正式獲批用于中國食管癌的免疫治療,在亞洲人群中,其將中位生存期從6.5個月提升到10個月,降低了37%的死亡或進展風險,而1年生存率也從23.9%提升到了43.5%[17]。然而,帕博利珠單抗僅能作為PD-L1高表達(綜合陽性評分≥10%)的晚期ESCC的二線治療,因此只有少部分的ESCC患者得到臨床獲益[17]。這一方面可能與腫瘤本身表達PD-L1有關,另一方面也與TME關系密切[18]。因此,有必要進一步探討免疫檢查點相關基因在TME和免疫細胞浸潤中的作用,研究出對ESCC的敏感藥物,對不同的ESCC實施個性化治療。
本研究探討了ESCC中免疫檢查點相關基因的表達模式、預后價值及對TME的影響,并試圖尋找對這些檢查點敏感的藥物。在這些基因中,8個基因(TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1、CD80、TNFRSF18)在食管癌中顯著高表達(log2FC>1和FDR<0.05),而PD-L1(CD274)只在食管癌中輕度升高(log2FC<1),PD-1(PDCD1)并無差異表達,這可能是一部分ESCC患者在PD-L1抑制劑中未獲益的部分原因。CTLA4與布加替尼(Brigatinib)、達沙替尼(Dasatinib)、依維莫司(Everolimus)、考比替尼(Cobimetinib)的半抑制濃度呈顯著負相關,說明這些藥物有治療CTLA4高表達食管癌的潛力。
此外,我們構建了一個基于3個免疫檢查點基因的預后模型,包括NRP1、ICOSLG和HHLA2,計算出的風險評分是ESCC的獨立預后因素,其在預測ESCC患者的預后結局方面表現優異,并且其在不同的食管亞型中也有較強的分層能力。Neuropilin-1(NRP1)是正常胚胎發育、血管形成所必需的神經元和內皮細胞受體,在抑制對癌癥的免疫應答中起著重要作用[19-20]。NRP1的表達與不良的臨床預后相關。一方面,NRP1通過多種通路支持腫瘤細胞的生長,比如細胞存活、新生血管生成和轉移。另一方面,NRP1通過在TME中協調多種抑制過程來促進免疫逃逸。NRP1在樹突狀細胞和巨噬細胞中的生理作用,有助于這些細胞的抗炎表型,被腫瘤“劫持”以促進腫瘤血管生成和腫瘤相關免疫抑制。另一方面,NRP1通過調節腫瘤內Treg細胞和CD8+T細胞的細胞外和細胞內抑制途徑直接影響適應性抗腫瘤免疫[20-21]。這和我們的結論相似,NRP1相較于正常組,在ESCC中高表達,其在模型中的風險系數是正數,這說明NRP1可能促進ESCC的發展并影響其預后。誘導T細胞共刺激配體(inducible T-cell co-stimulator-ligand,ICOSLG)是免疫調節配體B7家族成員,由于其能調節抗腫瘤適應性免疫,其在癌癥中的表達與疾病進展有關。Iwata等[22]發現在膠質母細胞瘤中,ICOSLG表達上調與膠質母細胞瘤患者預后不良相關,抑制膠質母細胞瘤中ICOSLG誘導的共刺激物為具有間充質特征升高的膠質母細胞瘤亞群提供了免疫治療的可能。在我們的分析中,ICOSLG在ESCC的表達水平低于正常組,其表達水平升高可能會增加不良預后風險。HHLA2是B7/CD28家族中新的免疫檢查點分子[23],其與CD28家族受體PD-1和CTLA-4結合,對T細胞的功能起著免疫抑制的調控作用[24-25]。HHLA2在預測預后的作用中出現了矛盾的結果,一方面,HHLA2在胰腺癌、壺腹癌和卵巢癌中與良好的預后密切相關[26-27];而一方面,在腎透明細胞癌中,HHLA2與PD-L1的共表達顯示預后不良[28]。在我們的研究中,HHLA2在ESCC中低表達,是一種保護性的預后因子。
在TME中,免疫細胞和基質細胞是兩種主要的非腫瘤組分,其被認為對腫瘤的發展和預后有重要價值[29]。基于ESTIMATE算法計算的免疫評分和基質評分可對TME中免疫細胞和腫瘤細胞進行定量,從而推算出腫瘤純度[30]。免疫評分和基質評分越高,腫瘤的純度越低。Zhang等[31]關于腦膠質瘤的研究表明,腫瘤純度越低,惡性程度更高、預后更差。一項結腸癌研究[32]也發現,腫瘤低純度是預后差的獨立危險因素,純度低的腫瘤突變負荷更高,免疫表型更強。這和我們的研究一致,高風險組腫瘤純度低于低風險組,其生存時間也顯著短于低風險組。此外,雖然高風險組中多種免疫細胞和免疫通路富集,但是高風險組中多個免疫檢查點基因富集明顯,這可能是導致高風險組免疫逃逸的原因。同時,針對高風險組ESCC患者,免疫檢查點抑制劑可能療效更好,因為其富集了較多的抗腫瘤免疫細胞,如CD8+T細胞、自然殺傷細胞等。在預測高低風險組的藥物敏感性時,相較于低風險組,高風險組也表現出對多種化合物更加敏感。
總之,我們構建了基于3個免疫檢查點基因的風險模型,其能更好將ESCC分層,是ESCC的獨立預后因素。高低風險組的ESCC有不同的通路富集、免疫細胞浸潤模式和TME,高風險組中存在多種不同的敏感藥物,這為以后ESCC的個性化治療提供了可能。
利益沖突:無。
作者貢獻:潘世澤、宋從寬和李寧負責設計研究;郝博、盧子龍、范濤、李東航、張霖、孟恒和賴凱負責對數據進行分析;潘世澤負責撰寫文章;耿慶負責審閱和修改文章。
食管癌是全球第8大最常見癌癥,癌癥死亡率占第6[1]。食管癌有兩種主要的組織學類型:腺癌和鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC),其病因、發病機制和生物學特征不同。食管癌發病率在西方國家逐年上升,其在亞洲國家仍占主導地位[2]。此外,ESCC的總體5年生存率仍然極差,復發和轉移概率較高[3]。盡管TNM分期已被廣泛用作預后因素,但由于ESCC的異質性,同一臨床階段患者的生存有很大差異。因此,迫切需要一個強大的預后生物標志物來對食管癌高風險患者進行臨床識別。
近年來,對免疫檢查點抑制劑[如程序性死亡受體-1(programmed cell death-1,PD-1)/程序性死亡受體-1配體(programmed cell death-1 ligand,PD-L1)抑制劑、細胞毒性T細胞抗原4(cytotoxic T lymphocyte-associated antigen 4,CTLA-4)抑制劑等]的研究,在ESCC中顯示出了有希望的結果。此外,免疫檢查點抑制劑和傳統的抗腫瘤策略聯合治療ESCC已經引起了研究者的廣泛興趣,結果令人鼓舞[4]。然而,由于耐藥性,只有少數患者獲得了臨床效益[5]。因此,在臨床實踐中,若能找到準確的預測標志物,并針對不同風險食管癌給予相應的敏感藥物,將有助于患者的個性化治療。
越來越多的證據[6]表明,腫瘤細胞內在因素(如PD-L1表達、腫瘤突變負荷和微衛星不穩定性高狀態)與免疫檢查點抑制劑的療效相關。此外,腫瘤對免疫治療的耐藥性可能由腫瘤浸潤淋巴細胞(tumor infiltrating lymphocytes,TILs)、腫瘤相關巨噬細胞(tumor-associated macrophages,TAMs)等巨噬細胞和骨髓來源的抑制細胞(myeloid-derived suppressor cells,MDSC)引起[7-9]。因此,更好地探索不同ESCC患者的腫瘤微環境(tumor microenvironment,TME),如腫瘤PD-L1的表達、TILs、TAMs和MDSCs,變得越來越重要。
在本研究中,我們探討了免疫檢查點基因的預后意義,并開發了新的基于3個免疫檢查點基因特征的風險評分來預測ESCC的預后。研究不同風險分組的免疫細胞浸潤情況、TME和藥物敏感性,為不同風險食管癌患者尋找新的潛在免疫檢查點和敏感藥物提供一種參考。
1 資料與方法
1.1 RNA測序數據資料和臨床數據
收集基因表達綜合數據庫(GEO)GSE53625數據集中ESCC樣本及其對應的癌旁正常組織樣本,提取免疫檢查點基因轉錄組測序數據和臨床資料。
1.2 方法
1.2.1 候選基因的鑒別
基于GSE53625數據集,利用“limma”R包識別出食管癌和正常組織之間的差異表達基因,臨界值為|log2FC|>0和FDR<0.05(FC:fold change,倍數變化;FDR:false discovery rate,錯誤發現率)。對這些差異表達基因進行單因素Cox分析,差異有統計學意義(P≤0.05)的基因被認為與預后相關。
1.2.2 與差異表達基因相關的藥物敏感性分析
從CellMiner(
1.2.3 風險模型的建立
與預后相關的基因被擬合到最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析中(使用“glmnet”R包),以降低數據的維數。使用“survival”R包進行多因素Cox分析,計算每個基因的系數。根據以下公式生成風險評分:風險評分=β1×G1+β2×G2......+βn×Gn,其中βn代表基因的系數,Gn為基因的表達水平。根據風險評分的中位值,將患者分為高、低風險組,驗證風險模型的分層能力。
1.2.4 對TME和免疫景觀的估計
為了描述ESCC免疫景觀,本研究應用ssGSEA分析[10]用于量化TME中各種免疫細胞的浸潤豐度和免疫通路。使用ESTIMATE算法[11]估計惡性腫瘤中基質和免疫細胞含量,并推斷腫瘤純度、計算免疫和基質評分。免疫評分高、腫瘤純度低,說明腫瘤組織中免疫細胞和基質細胞含量豐富。
1.2.5 不同風險組的藥物敏感性
半抑制濃度是評估藥物療效或樣本治療反應的重要指標。基于樣本轉錄組,我們使用“pRp”R包[12]評估每個樣本的半抑制濃度,以比較不同風險亞組的藥物敏感性。半抑制濃度值越高,藥物敏感性就越低。
1.3 統計學分析
采用Kaplan-Meier方法評價高低風險組之間的總生存期(overall survival,OS),采用log-rank方法驗證顯著性差異。采用t檢驗分析不同風險組的免疫細胞分布、免疫通路、TME和藥物敏感性。采用Cox比例風險回歸模型計算獨立預后因素。在所有的分析方法中,P≤0.05為差異有統計學意義。使用R4.0.1(
2 結果
2.1 一般資料
共收集GSE53625 數據集中的358 個樣本,囊括了 89 383 個全基因組和非編碼 RNA 信息,包含來自 179 例患者的 ESCC 樣本及其癌旁組織樣本,其中男 33 例、女 146 例,≤60 歲 80 例,>60 歲 99 例;見表1。

2.2 篩選差異基因和差異基因藥物敏感性
基于GSE53625數據集的樣本數據,首先對免疫檢查點基因數據集進行標準化處理,然后繪制熱圖并展示不同免疫檢查點基因在ESCC組和ESCC癌旁組中的表達情況;見圖1a。篩選39個差異表達的免疫檢查點基因,其中包括14個低表達基因(CD200R1、CD40LG、BTLA、VSIR、CD160、ICOSLG、CD70、IDO2、CD200、TMIGD2、TNFSF14、CD244、LGALS9、CD48),25個高表達基因(CD44、HAVCR2、HHLA2、TNFRSF25、NRP1、CD274、TIGIT、KIR3DL1、VTCN1、TNFSF9、TNFSF18、LAIR1、ICOS、LAG3、CD86、PDCD1LG2、TNFRSF9、TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1、CD80、TNFRSF18)(log2FC>0和FDR<0.05);見圖1b。其中8個基因(TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1、CD80、TNFRSF18)在食管癌中顯著高表達(log2FC>1和FDR<0.05),探索針對這8個基因的敏感藥物,發現多個化合物與這些基因顯著相關(P<0.05);見圖1c。

a:所有免疫檢查點基因表達特征熱圖(藍色:低表達,紅色:高表達);b:腫瘤和正常組織中差異表達基因;c:顯著高表達的免疫檢查點基因與藥物Z評分相關性(藍色:負相關,紅色:正相關,線條粗細代表相關性強弱)
2.3 候選基因篩選和模型構建
單因素Cox分析篩選出3個預后相關基因[NRP1:HR=1.484(1.026,2.144),P=0.036;ICOSLG:HR=1.265(1.001,1.599),P=0.049;HHLA2:HR=0.666(0.504,0.881),P=0.004]。將這3個候選基因進行LASSO回歸分析,進行100次交叉驗證以避免過度擬合,然后將這3個候選基因繼續多因素Cox分析(逐步回歸法);見圖2a~b。最后,基于這3個基因[進行log2(FPKM+1)標準化]構建ESCC風險模型,風險評分=(0.25344×NRP1)+(0.2314×ICOSLG)+(?0.3181×HHLA2),并根據風險評分中位值將樣本分為高低風險組。其中,高風險組有較高比例的死亡樣本,而低風險組存活的人數較多;見圖2c~d。主成分分析和t-分布領域嵌入算法分析顯示,根據風險評分可以很好地將ESCC分為兩類,這說明基于3個免疫檢查點基因的風險模型具有很好的分層能力;見圖2e~f。這在生存分析中得到了充分驗證,高風險組的生存率顯著低于低風險組(P<0.001);見圖2g。此外,單因素和多因素Cox分析顯示,3個免疫檢查點基因的風險評分是ESCC的獨立預后因素(P=0.001);見圖2h~i。

a:3個候選基因的LASSO回歸特征譜;b:在LASSO模型中對候選基因參數進行100倍交叉驗證;c~d:風險評分和生存狀態的分布;e~f:基于風險評分的主成分分析和
2.4 不同ESCC亞型分析
為了驗證風險評分的分層能力,我們進一步對不同食管癌亞型進行Kaplan-Meier分析,結果發現對不同性別、年齡、T分期和N分期、腫瘤部位和是否吸煙患者,基于3個免疫檢查點基因的模型均有較強的分層能力,低風險組的OS顯著長于高風險組(P<0.05)。在無吸煙史的病例中,我們觀察到預測模型不能將病例很好地區分開來(P=0.306),這可能與納入的病例數較少有關;見圖3。

a~b:不同年齡的OS生存曲線;c~d:不同性別的OS生存曲線;e~f:不同T分期的OS生存曲線;g~h:不同N分期的OS生存曲線;i~k:不同腫瘤部位的OS生存曲線;l~n:不同腫瘤分化的OS生存曲線;o~p:不同吸煙史的OS生存曲線;OS:總生存期
2.5 不同風險分組的通路差異富集
為了識別不同風險亞組之間的生物學行為,我們進行了Metascape分析[13]。首先獲得高低風險分組之間2 697個差異表達的基因。其中1 551個基因在高風險組中高表達,Metascape分析結果顯示,這些基因在高風險組主要參與細胞激活調控、免疫調節、NABA核心基質、樹突細胞分化和自然殺傷細胞趨化等通路;見圖4a。而1 146個基因在低風險組中高表達,這些基因在低風險組主要富集于內肽酶活性負性調控、NABA基質相關(典型途徑)、脂肪酸代謝和糖攝入等通路中;見圖4b。

a:高風險組的通路富集;b:低風險組的通路富集
2.6 不同風險組的TME和藥物敏感性
使用ssGSEA[10]分析了每個樣本中16種免疫細胞的浸潤豐度和13種免疫相關通路,結果發現相對于低風險組,高風險組中富集較高比例的B細胞、DC細胞、CD8+T細胞、Th2細胞和TILs細胞(P<0.05);見圖5a。并且在多個免疫通路中高度富集,比如抗原呈遞細胞共刺激、免疫檢查點、細胞溶解激活、人類白細胞抗原系統、促炎和T細胞共刺激或共抑制等通路(P<0.05);見圖5b。比較不同分組中免疫檢查點基因表達情況,發現多個基因在高風險組中富集(CD40LG、BTLA、ICOSLG、IDO2、TMIGD2、TNFSF14、CD244、LGALS9、CD48、TNFSF15、CD28、CD40、ADORA2A、PDCD1、HAVCR2、CD27、TNFRSF25、NRP1、TIGIT、TNFSF9、LAIR1、ICOS、LAG3、CD86、TNFRSF9、TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1),只有HHLA2和KIR3DL1在低風險組中富集,而PD-L1(CD274)在高低風險組中未見差異表達;見圖5c。使用ESTIMATE算法[11]評估每個樣本中的TME,發現高風險組具有較高的基質評分、免疫評分,而低風險組中腫瘤純度顯著高于高風險組(P<0.05);圖5d~g。幾種常用藥物(硼替佐米、帕唑帕尼、阿糖胞苷、伏立諾他、長春新堿、伊利司莫、吉西他濱、索拉非尼、博來霉素、替吡法尼、阿霉素、依托泊苷)在高風險組中有較低半抑制濃度,這表明高風險組患者對這些藥物的敏感性可能較高;見圖6。

a:不同風險組的免疫細胞浸潤;b:不同風險組的免疫相關通路;c:不同風險組中免疫檢查點基因表達;d:不同風險組的基質評分;e:不同風險組的免疫評分;f:不同風險組的綜合評分;g:不同風險組的腫瘤純度

3 討論
ESCC是一種高度惡性的腫瘤,手術聯合放療、化療和靶向治療是目前ESCC的主要治療方法。然而,由于高復發率和轉移率,食管癌的生存結果仍不滿意[14-16]。雖然涉及食管癌的相關免疫治療仍處于初步研究階段,但一些相關抑制劑已進入臨床試驗,顯示出持久的抗腫瘤活性和可控的不良反應,提示ESCC的免疫微環境和免疫檢查靶點值得進一步探索[1]。抗PD-L1的帕博利珠單抗正式獲批用于中國食管癌的免疫治療,在亞洲人群中,其將中位生存期從6.5個月提升到10個月,降低了37%的死亡或進展風險,而1年生存率也從23.9%提升到了43.5%[17]。然而,帕博利珠單抗僅能作為PD-L1高表達(綜合陽性評分≥10%)的晚期ESCC的二線治療,因此只有少部分的ESCC患者得到臨床獲益[17]。這一方面可能與腫瘤本身表達PD-L1有關,另一方面也與TME關系密切[18]。因此,有必要進一步探討免疫檢查點相關基因在TME和免疫細胞浸潤中的作用,研究出對ESCC的敏感藥物,對不同的ESCC實施個性化治療。
本研究探討了ESCC中免疫檢查點相關基因的表達模式、預后價值及對TME的影響,并試圖尋找對這些檢查點敏感的藥物。在這些基因中,8個基因(TNFRSF8、CTLA4、TNFRSF4、CD276、TNFSF4、IDO1、CD80、TNFRSF18)在食管癌中顯著高表達(log2FC>1和FDR<0.05),而PD-L1(CD274)只在食管癌中輕度升高(log2FC<1),PD-1(PDCD1)并無差異表達,這可能是一部分ESCC患者在PD-L1抑制劑中未獲益的部分原因。CTLA4與布加替尼(Brigatinib)、達沙替尼(Dasatinib)、依維莫司(Everolimus)、考比替尼(Cobimetinib)的半抑制濃度呈顯著負相關,說明這些藥物有治療CTLA4高表達食管癌的潛力。
此外,我們構建了一個基于3個免疫檢查點基因的預后模型,包括NRP1、ICOSLG和HHLA2,計算出的風險評分是ESCC的獨立預后因素,其在預測ESCC患者的預后結局方面表現優異,并且其在不同的食管亞型中也有較強的分層能力。Neuropilin-1(NRP1)是正常胚胎發育、血管形成所必需的神經元和內皮細胞受體,在抑制對癌癥的免疫應答中起著重要作用[19-20]。NRP1的表達與不良的臨床預后相關。一方面,NRP1通過多種通路支持腫瘤細胞的生長,比如細胞存活、新生血管生成和轉移。另一方面,NRP1通過在TME中協調多種抑制過程來促進免疫逃逸。NRP1在樹突狀細胞和巨噬細胞中的生理作用,有助于這些細胞的抗炎表型,被腫瘤“劫持”以促進腫瘤血管生成和腫瘤相關免疫抑制。另一方面,NRP1通過調節腫瘤內Treg細胞和CD8+T細胞的細胞外和細胞內抑制途徑直接影響適應性抗腫瘤免疫[20-21]。這和我們的結論相似,NRP1相較于正常組,在ESCC中高表達,其在模型中的風險系數是正數,這說明NRP1可能促進ESCC的發展并影響其預后。誘導T細胞共刺激配體(inducible T-cell co-stimulator-ligand,ICOSLG)是免疫調節配體B7家族成員,由于其能調節抗腫瘤適應性免疫,其在癌癥中的表達與疾病進展有關。Iwata等[22]發現在膠質母細胞瘤中,ICOSLG表達上調與膠質母細胞瘤患者預后不良相關,抑制膠質母細胞瘤中ICOSLG誘導的共刺激物為具有間充質特征升高的膠質母細胞瘤亞群提供了免疫治療的可能。在我們的分析中,ICOSLG在ESCC的表達水平低于正常組,其表達水平升高可能會增加不良預后風險。HHLA2是B7/CD28家族中新的免疫檢查點分子[23],其與CD28家族受體PD-1和CTLA-4結合,對T細胞的功能起著免疫抑制的調控作用[24-25]。HHLA2在預測預后的作用中出現了矛盾的結果,一方面,HHLA2在胰腺癌、壺腹癌和卵巢癌中與良好的預后密切相關[26-27];而一方面,在腎透明細胞癌中,HHLA2與PD-L1的共表達顯示預后不良[28]。在我們的研究中,HHLA2在ESCC中低表達,是一種保護性的預后因子。
在TME中,免疫細胞和基質細胞是兩種主要的非腫瘤組分,其被認為對腫瘤的發展和預后有重要價值[29]。基于ESTIMATE算法計算的免疫評分和基質評分可對TME中免疫細胞和腫瘤細胞進行定量,從而推算出腫瘤純度[30]。免疫評分和基質評分越高,腫瘤的純度越低。Zhang等[31]關于腦膠質瘤的研究表明,腫瘤純度越低,惡性程度更高、預后更差。一項結腸癌研究[32]也發現,腫瘤低純度是預后差的獨立危險因素,純度低的腫瘤突變負荷更高,免疫表型更強。這和我們的研究一致,高風險組腫瘤純度低于低風險組,其生存時間也顯著短于低風險組。此外,雖然高風險組中多種免疫細胞和免疫通路富集,但是高風險組中多個免疫檢查點基因富集明顯,這可能是導致高風險組免疫逃逸的原因。同時,針對高風險組ESCC患者,免疫檢查點抑制劑可能療效更好,因為其富集了較多的抗腫瘤免疫細胞,如CD8+T細胞、自然殺傷細胞等。在預測高低風險組的藥物敏感性時,相較于低風險組,高風險組也表現出對多種化合物更加敏感。
總之,我們構建了基于3個免疫檢查點基因的風險模型,其能更好將ESCC分層,是ESCC的獨立預后因素。高低風險組的ESCC有不同的通路富集、免疫細胞浸潤模式和TME,高風險組中存在多種不同的敏感藥物,這為以后ESCC的個性化治療提供了可能。
利益沖突:無。
作者貢獻:潘世澤、宋從寬和李寧負責設計研究;郝博、盧子龍、范濤、李東航、張霖、孟恒和賴凱負責對數據進行分析;潘世澤負責撰寫文章;耿慶負責審閱和修改文章。