引用本文: 何陽, 楊宏昊, 康雨朦, 張紫嫣, 劉舒鵬, 徐洪, 楊方, 楊潔. 基于生物信息學方法篩選玫瑰痤瘡關鍵基因與信號通路. 華西醫學, 2021, 36(9): 1232-1238. doi: 10.7507/1002-0179.202107154 復制
玫瑰痤瘡是一種常見的主要累及面部皮膚、血管及毛囊皮脂腺的慢性炎癥性皮膚病,國際患病率約為 5.46%,女性高于男性,高發年齡為 45~60 歲[1]。該病主要表現為反復發作的面部紅斑,早期以毛細血管擴張、丘疹、膿皰、水腫為主要臨床表現,晚期則進展為皮膚纖維化[2],嚴重影響患者心理健康和生活質量[3-4]。玫瑰痤瘡根據臨床表現分為紅斑毛細血管擴張型(erythematotelangiectatic rosacea,ETR)、丘疹膿皰型(papulopustular rosacea,PPR)、鼻贅型(phymatous rosacea,PHR)和眼型(ocular rosacea,OC)4 種亞型[5]。該病的發病機制主要與免疫功能異常、血管舒縮功能障礙、神經血管調節功能失調和微生物感染等有關[6-8],但其確切分子機制尚不完全清楚。近年來越來越多研究采用基因測序技術、基因芯片表達譜分析與生物信息學分析相結合的方法了解疾病的發病機制,從而尋找治療疾病的靶分子。如基于生物信息學分析發現,MFSD12 是黑色素瘤細胞增殖的促進因子和潛在治療靶點[9],細胞因子信號通路和 RIG-I 樣受體信號通路參與了銀屑病的發病機制 [10]。因此,本研究擬通過生物信息學方法篩選出不同類型玫瑰痤瘡患者皮膚與非玫瑰痤瘡患者正常皮膚中的差異基因,并進行相應的生物信息學分析,以助于從分子水平解析玫瑰痤瘡的發病機制。現報告如下。
1 資料與方法
1.1 數據集的獲取和資料分析
使用“rosacea”為關鍵詞在基因表達綜合數據庫(Gene Expression Omnibus,GEO)(
1.2 數據分析流程
將基因芯片數據在 GEO2R(
1.3 差異基因的篩選
GEO2R 是一個基于 R 語言程序的尋找差異基因的分析工具[12]。在選取的數據集GSE65914中,患者皮損包含ETR、PPR、PHR 3 型玫瑰痤瘡,未納入 OC 型玫瑰痤瘡。因此,通過 GEO2R 分析玫瑰痤瘡 3 種亞型(ETR、PPR 和 PHR)患者和健康對照組的基因差異表達情況,將 P<0.05 并且差異表達變化倍數|logFC|≥1 的數據納入標準,用微生信云平臺(
1.4 基因功能富集分析
通過在 DAVID 數據庫(
1.5 蛋白質相互作用(protein-protein interaction,PPI)網絡及關鍵基因的篩選
使用 String 在線數據庫(https://string-db.org/)構建 PPI 網絡分析蛋白質之間的相互作用[14]。為了更進一步分析差異基因潛在關系,將 String 構建的 PPI 數據導入 Cytoscape 軟件(3.7.2 版本)[15]。使用 Cytoscape 的 Mcode 插件分析 PPI 的最有意義的模塊[16],使用 Cytohubba 分析得到關鍵基因[17]。利用 ClueGO 插件對篩選得到的 10 個關鍵基因進行生物功能注釋分析[18]。
2 結果
2.1 差異基因的篩選
應用 GEO2R 對 GSE65914 數據集進行數據矯正及差異分析,以 P<0.05 且差異倍數|log FC|≥1 為篩選條件,分別從 ETR、PPR 和 PHR 組中得到 1 795、2 746、2 751 個差異基因。使用微生信云平臺分析繪制得到差異基因的火山圖(圖 1)和韋恩圖(圖 2),可見玫瑰痤瘡 3 種亞型有 957 個共同的差異基因,其中上調的差異基因 533 個,下調的差異基因 424 個。

a. ETR 與正常對照;b. PPR 與正常對照;c. PHR 與正常對照。紅色代表上調差異基因,藍色代表下調差異基因,灰色代表非差異基因

a. 上調的差異基因;b. 下調的差異基因。綠色代表 PHR 中的差異基因,藍色代表 PPR 中的差異基因,紅色代表 ETR 中的差異基因
2.2 共同差異基因功能富集分析
GO 富集分析結果顯示,差異基因富集的生物途徑主要在免疫反應、炎癥反應、細胞間信號轉導、T 細胞增殖的正調控、趨化因子介導的信號通路、細胞表面受體信號通路、對干擾素-γ 的細胞反應等方面(圖 3a)。細胞組分主要富集在細胞外間隙、細胞外區、細胞表面、細胞外外泌體、細胞外基質、質膜和角質化包膜等部位(圖 3b)。分子功能主要富集在趨化因子活性、肝素結合、絲氨酸型內肽酶活性、蛋白質同二聚化活性、表皮生長因子受體結合、CXCR3 趨化因子受體結合,和花生四烯酸結合及細胞因子活性等方面(圖 3c)。KEGG 結果顯示,上述共同差異表達的基因在細胞因子-細胞因子受體相互作用、類風濕關節炎、趨化因子信號通路、PPAR 信號通路、Toll 樣受體(Toll-likereceptor,TLR)信號通路、核轉錄因子(nuclear transcription factor,NF)-κB 信號通路和腫瘤壞死因子(tumor necrosis factor,TNF)信號通路可能發揮一定作用(圖 3d)。

a. 生物過程;b. 分子功能;c. 細胞成分;d. 信號通路。橫坐標代表富集倍數,縱坐標代表富集名稱;KEGG pathway:pathway 信號通路,enrichment:富集倍數,count:基因數;用氣泡的大小程度表示,氣泡越大、顏色越深表示富集的通路越重要、越相關
2.3 差異基因相關 PPI 網絡分析
通過 STRING 在線工具和 Cytoscape 軟件對 953 個差異基因進行 PPI 網絡分析。在 Cytoscape 中得到 771 個節點和 4 828 條相互作用的網絡圖。在 PPI 網絡中,利用 Cytoscape 中的 Mcode 插件篩選出最顯著模塊,其中包括 33 個重要節點及 270 條相互作用的網絡圖。運用 Cytohubba 插件,以各蛋白之間相互關聯緊密程度的等級(degree)為標準篩選出總分排名前 10 位的關鍵基因,分別是 PTPRC、MMP9、CCR5、IL1B、TLR2、STAT1、CXCR4、CXCL10、CCL5 和 VCAM1。最終,采用 ClueGO 對上述 10 個關鍵基因進行生物功能注釋分析。見圖 4、表 1。

a. PPI 網絡(紅色代表上調基因,藍色代表下調基因);b. PPI 中最顯著模塊(紅色代表上調基因,藍色代表下調基因);c. 關鍵基因(黃色到藍色代表節點關系越來越密切);d. 關鍵基因功能富集(4 種顏色代表富集的 4 類生物功能)

3 討論
生物信息學主要以計算機為工具,開發各種生物信息學軟件,對基因和蛋白質的序列、結構等相關信息進行分析,建立相應的理論模型,以了解生物大分子隱藏的信息的生物學意義[19]。
在本研究中,用生物信息學方法篩選出差異基因并進一步分析得知,3 種亞型玫瑰痤瘡的差異基因都參與了炎癥反應、免疫反應的生物過程以及細胞表面、細胞外間隙和外泌體的細胞定位。關于分子功能中趨化因子活性,有關研究表明,紫外線輻射、熱、冷、辛辣食物和微生物調節 TLR 誘導抗菌肽的產生,導致其下游細胞因子和趨化因子介導了玫瑰痤瘡的炎癥反應[20-21]。KEGG 分析顯示,差異基因主要富集于細胞因子-細胞因子受體相互作用信號通路、趨化因子信號通路、PPAR 信號通路、TNF 信號通路、TLR 信號通路、NF-κB 信號通路、類風濕關節炎等信號通路。TLR 是單跨膜細胞表面受體,通常以同型二聚體的形式存在于巨噬細胞、肥大細胞和 B 淋巴細胞等免疫細胞上,在病原體識別和先天免疫激活中起重要作用。以往研究表明,在玫瑰痤瘡小鼠中,TLR 信號通路異常激活導致 NF-κB 激活最終導致皮膚炎癥反應[20]。TNF 參與了廣泛的生物過程的調節,包括細胞增殖、分化、凋亡、脂質代謝和凝血。TNF 信號通路的激活同樣在玫瑰痤瘡中也起著關鍵的作用[21]。
在 PPI 分析中,篩選的 10 個關鍵基因在趨化因子介導的信號通路、神經炎癥反應的調節、趨化因子受體結合以及膠質細胞再生的正向調控途徑中起關鍵作用。其中,PTPRC 基因編碼的蛋白質是酪氨酸磷酸酶家族的成員,其是參與調節細胞生長、分化、有絲分裂等多種細胞信號過程的信號分子,亦是 T 細胞和 B 細胞抗原受體信號傳導的重要調節器[22]。目前大多是關于 PTPRC 基因與多發性硬化癥、類風濕關節炎和系統性紅斑狼瘡疾病的研究[23-24],本研究發現 PTPRC 在玫瑰痤瘡的發生發展中可能起重要作用,因此需要進一步的研究來闡明 PTPRC 在玫瑰痤瘡中的可能發生的作用。本研究結果還顯示,3 種玫瑰痤瘡患者趨化因子 CXCR4、CXCL10、CCL5 和 CCR5 均升高,這可能與玫瑰痤瘡患者免疫功能障礙、炎癥反應有關,在抗菌肽 LL37 誘導的玫瑰痤瘡小鼠中也發現,趨化因子 CCXL10、CCL5 和 CCR5 表達上調,伴隨皮膚毛細血管擴張、紅斑、膿皰等皮膚炎癥[25-26]。此外,已有研究證明 TLR2 在玫瑰痤瘡中顯著升高,且其信號通路異常激活是玫瑰痤瘡皮膚炎癥發生的重要機制[26-28]。最近一項研究表明,轉錄因子 STAT1 介導免疫細胞和角質形成細胞的相互作用在玫瑰痤瘡的發病起著重要作用[29],這些均與本研究結果具有一致性。
綜上所述,本研究應用生物信息學方法尋找到與玫瑰痤瘡相關的可能的基因和關鍵通路,有望為玫瑰痤瘡的診斷和治療提供新的分子標志物。但本研究分析數據庫樣本量較小,玫瑰痤瘡相關基礎研究較少,上述關鍵基因尚不能作玫瑰痤瘡診斷以及藥物作用靶點基因,需增加樣本量以及進一步體內外實驗驗證。
玫瑰痤瘡是一種常見的主要累及面部皮膚、血管及毛囊皮脂腺的慢性炎癥性皮膚病,國際患病率約為 5.46%,女性高于男性,高發年齡為 45~60 歲[1]。該病主要表現為反復發作的面部紅斑,早期以毛細血管擴張、丘疹、膿皰、水腫為主要臨床表現,晚期則進展為皮膚纖維化[2],嚴重影響患者心理健康和生活質量[3-4]。玫瑰痤瘡根據臨床表現分為紅斑毛細血管擴張型(erythematotelangiectatic rosacea,ETR)、丘疹膿皰型(papulopustular rosacea,PPR)、鼻贅型(phymatous rosacea,PHR)和眼型(ocular rosacea,OC)4 種亞型[5]。該病的發病機制主要與免疫功能異常、血管舒縮功能障礙、神經血管調節功能失調和微生物感染等有關[6-8],但其確切分子機制尚不完全清楚。近年來越來越多研究采用基因測序技術、基因芯片表達譜分析與生物信息學分析相結合的方法了解疾病的發病機制,從而尋找治療疾病的靶分子。如基于生物信息學分析發現,MFSD12 是黑色素瘤細胞增殖的促進因子和潛在治療靶點[9],細胞因子信號通路和 RIG-I 樣受體信號通路參與了銀屑病的發病機制 [10]。因此,本研究擬通過生物信息學方法篩選出不同類型玫瑰痤瘡患者皮膚與非玫瑰痤瘡患者正常皮膚中的差異基因,并進行相應的生物信息學分析,以助于從分子水平解析玫瑰痤瘡的發病機制。現報告如下。
1 資料與方法
1.1 數據集的獲取和資料分析
使用“rosacea”為關鍵詞在基因表達綜合數據庫(Gene Expression Omnibus,GEO)(
1.2 數據分析流程
將基因芯片數據在 GEO2R(
1.3 差異基因的篩選
GEO2R 是一個基于 R 語言程序的尋找差異基因的分析工具[12]。在選取的數據集GSE65914中,患者皮損包含ETR、PPR、PHR 3 型玫瑰痤瘡,未納入 OC 型玫瑰痤瘡。因此,通過 GEO2R 分析玫瑰痤瘡 3 種亞型(ETR、PPR 和 PHR)患者和健康對照組的基因差異表達情況,將 P<0.05 并且差異表達變化倍數|logFC|≥1 的數據納入標準,用微生信云平臺(
1.4 基因功能富集分析
通過在 DAVID 數據庫(
1.5 蛋白質相互作用(protein-protein interaction,PPI)網絡及關鍵基因的篩選
使用 String 在線數據庫(https://string-db.org/)構建 PPI 網絡分析蛋白質之間的相互作用[14]。為了更進一步分析差異基因潛在關系,將 String 構建的 PPI 數據導入 Cytoscape 軟件(3.7.2 版本)[15]。使用 Cytoscape 的 Mcode 插件分析 PPI 的最有意義的模塊[16],使用 Cytohubba 分析得到關鍵基因[17]。利用 ClueGO 插件對篩選得到的 10 個關鍵基因進行生物功能注釋分析[18]。
2 結果
2.1 差異基因的篩選
應用 GEO2R 對 GSE65914 數據集進行數據矯正及差異分析,以 P<0.05 且差異倍數|log FC|≥1 為篩選條件,分別從 ETR、PPR 和 PHR 組中得到 1 795、2 746、2 751 個差異基因。使用微生信云平臺分析繪制得到差異基因的火山圖(圖 1)和韋恩圖(圖 2),可見玫瑰痤瘡 3 種亞型有 957 個共同的差異基因,其中上調的差異基因 533 個,下調的差異基因 424 個。

a. ETR 與正常對照;b. PPR 與正常對照;c. PHR 與正常對照。紅色代表上調差異基因,藍色代表下調差異基因,灰色代表非差異基因

a. 上調的差異基因;b. 下調的差異基因。綠色代表 PHR 中的差異基因,藍色代表 PPR 中的差異基因,紅色代表 ETR 中的差異基因
2.2 共同差異基因功能富集分析
GO 富集分析結果顯示,差異基因富集的生物途徑主要在免疫反應、炎癥反應、細胞間信號轉導、T 細胞增殖的正調控、趨化因子介導的信號通路、細胞表面受體信號通路、對干擾素-γ 的細胞反應等方面(圖 3a)。細胞組分主要富集在細胞外間隙、細胞外區、細胞表面、細胞外外泌體、細胞外基質、質膜和角質化包膜等部位(圖 3b)。分子功能主要富集在趨化因子活性、肝素結合、絲氨酸型內肽酶活性、蛋白質同二聚化活性、表皮生長因子受體結合、CXCR3 趨化因子受體結合,和花生四烯酸結合及細胞因子活性等方面(圖 3c)。KEGG 結果顯示,上述共同差異表達的基因在細胞因子-細胞因子受體相互作用、類風濕關節炎、趨化因子信號通路、PPAR 信號通路、Toll 樣受體(Toll-likereceptor,TLR)信號通路、核轉錄因子(nuclear transcription factor,NF)-κB 信號通路和腫瘤壞死因子(tumor necrosis factor,TNF)信號通路可能發揮一定作用(圖 3d)。

a. 生物過程;b. 分子功能;c. 細胞成分;d. 信號通路。橫坐標代表富集倍數,縱坐標代表富集名稱;KEGG pathway:pathway 信號通路,enrichment:富集倍數,count:基因數;用氣泡的大小程度表示,氣泡越大、顏色越深表示富集的通路越重要、越相關
2.3 差異基因相關 PPI 網絡分析
通過 STRING 在線工具和 Cytoscape 軟件對 953 個差異基因進行 PPI 網絡分析。在 Cytoscape 中得到 771 個節點和 4 828 條相互作用的網絡圖。在 PPI 網絡中,利用 Cytoscape 中的 Mcode 插件篩選出最顯著模塊,其中包括 33 個重要節點及 270 條相互作用的網絡圖。運用 Cytohubba 插件,以各蛋白之間相互關聯緊密程度的等級(degree)為標準篩選出總分排名前 10 位的關鍵基因,分別是 PTPRC、MMP9、CCR5、IL1B、TLR2、STAT1、CXCR4、CXCL10、CCL5 和 VCAM1。最終,采用 ClueGO 對上述 10 個關鍵基因進行生物功能注釋分析。見圖 4、表 1。

a. PPI 網絡(紅色代表上調基因,藍色代表下調基因);b. PPI 中最顯著模塊(紅色代表上調基因,藍色代表下調基因);c. 關鍵基因(黃色到藍色代表節點關系越來越密切);d. 關鍵基因功能富集(4 種顏色代表富集的 4 類生物功能)

3 討論
生物信息學主要以計算機為工具,開發各種生物信息學軟件,對基因和蛋白質的序列、結構等相關信息進行分析,建立相應的理論模型,以了解生物大分子隱藏的信息的生物學意義[19]。
在本研究中,用生物信息學方法篩選出差異基因并進一步分析得知,3 種亞型玫瑰痤瘡的差異基因都參與了炎癥反應、免疫反應的生物過程以及細胞表面、細胞外間隙和外泌體的細胞定位。關于分子功能中趨化因子活性,有關研究表明,紫外線輻射、熱、冷、辛辣食物和微生物調節 TLR 誘導抗菌肽的產生,導致其下游細胞因子和趨化因子介導了玫瑰痤瘡的炎癥反應[20-21]。KEGG 分析顯示,差異基因主要富集于細胞因子-細胞因子受體相互作用信號通路、趨化因子信號通路、PPAR 信號通路、TNF 信號通路、TLR 信號通路、NF-κB 信號通路、類風濕關節炎等信號通路。TLR 是單跨膜細胞表面受體,通常以同型二聚體的形式存在于巨噬細胞、肥大細胞和 B 淋巴細胞等免疫細胞上,在病原體識別和先天免疫激活中起重要作用。以往研究表明,在玫瑰痤瘡小鼠中,TLR 信號通路異常激活導致 NF-κB 激活最終導致皮膚炎癥反應[20]。TNF 參與了廣泛的生物過程的調節,包括細胞增殖、分化、凋亡、脂質代謝和凝血。TNF 信號通路的激活同樣在玫瑰痤瘡中也起著關鍵的作用[21]。
在 PPI 分析中,篩選的 10 個關鍵基因在趨化因子介導的信號通路、神經炎癥反應的調節、趨化因子受體結合以及膠質細胞再生的正向調控途徑中起關鍵作用。其中,PTPRC 基因編碼的蛋白質是酪氨酸磷酸酶家族的成員,其是參與調節細胞生長、分化、有絲分裂等多種細胞信號過程的信號分子,亦是 T 細胞和 B 細胞抗原受體信號傳導的重要調節器[22]。目前大多是關于 PTPRC 基因與多發性硬化癥、類風濕關節炎和系統性紅斑狼瘡疾病的研究[23-24],本研究發現 PTPRC 在玫瑰痤瘡的發生發展中可能起重要作用,因此需要進一步的研究來闡明 PTPRC 在玫瑰痤瘡中的可能發生的作用。本研究結果還顯示,3 種玫瑰痤瘡患者趨化因子 CXCR4、CXCL10、CCL5 和 CCR5 均升高,這可能與玫瑰痤瘡患者免疫功能障礙、炎癥反應有關,在抗菌肽 LL37 誘導的玫瑰痤瘡小鼠中也發現,趨化因子 CCXL10、CCL5 和 CCR5 表達上調,伴隨皮膚毛細血管擴張、紅斑、膿皰等皮膚炎癥[25-26]。此外,已有研究證明 TLR2 在玫瑰痤瘡中顯著升高,且其信號通路異常激活是玫瑰痤瘡皮膚炎癥發生的重要機制[26-28]。最近一項研究表明,轉錄因子 STAT1 介導免疫細胞和角質形成細胞的相互作用在玫瑰痤瘡的發病起著重要作用[29],這些均與本研究結果具有一致性。
綜上所述,本研究應用生物信息學方法尋找到與玫瑰痤瘡相關的可能的基因和關鍵通路,有望為玫瑰痤瘡的診斷和治療提供新的分子標志物。但本研究分析數據庫樣本量較小,玫瑰痤瘡相關基礎研究較少,上述關鍵基因尚不能作玫瑰痤瘡診斷以及藥物作用靶點基因,需增加樣本量以及進一步體內外實驗驗證。