引用本文: 王行行, 戚迪, 何婧, 鄧旺, 王導新, 趙燕. 急性呼吸窘迫綜合征患者中性粒細胞基因表達譜的生物信息學分析. 中國呼吸與危重監護雜志, 2021, 20(11): 789-794. doi: 10.7507/1671-6205.202107037 復制
自急性呼吸窘迫綜合征(ARDS)首次被描述的近50年來,通過對血漿及支氣管肺泡灌洗液中蛋白質差異表達的探索,對ARDS的研究在危險因素、致病因素以及表征模式方面取得了實質性進展,但仍未發現有顯著降低ARDS患者病死率的“神奇”藥物。其原因與ARDS患者不同炎癥狀態的異質性、對不同藥物的反應性等相關[1]。氣道內中性粒細胞積累導致活性氧、細胞因子、蛋白酶、中性粒細胞胞外誘捕網釋放,為ARDS患者發生肺組織損傷的主要元兇。但由于分離臨床樣本中肺泡中性粒細胞困難大,中性粒細胞在ARDS中的功能活動是否存在差異鮮有報道,其分化表型是否存在異質性也少見研究涉獵[2]。隨著基因組學和信息技術的發展,對疾病表型和差異基因的解讀更深入,也為ARDS患者的精準治療帶來希望。藉此,本研究擬通過生物信息分析手段,從ARDS可能的發病機制入手,提供潛在的治療靶點以供參考。
1 材料與方法
1.1 芯片數據收集
基于Pubmed-NCBI網站(
1.2 差異基因篩選
以在線工具GEO2R(
1.3 蛋白質–蛋白質相互作用網絡分析
將1.2所獲得的差異基因導入在線分析工具STRING version 11.0(
1.4 核心基因分析
從STRING下載PPI分析時產生的TSV文件導入Cytoscape軟件3.7.2(美國國家普通醫學科學研究所開發),使用MCODE插件進一步分析核心基因。
1.5 基因功能分析
將GEO2R篩選出來的差異表達基因導入DAVID功能分析網站(
2 結果
2.1 篩選獲得GSE76293
在GEO數據庫中以Series,Expression profiling by array和Homo sapiens為限定條件,ARDS為檢索詞,獲得12條結果。Juss等[3]進行了一項關于磷酸肌醇3-激酶抑制ARDS中中性粒細胞敏感性的研究。該研究比較了ARDS患者與資料匹配的健康志愿者的中性粒細胞轉錄譜差異,是進一步挖掘中性粒細胞功能的理想選擇,故我們選擇該研究相關的芯片GSE76293數據進行生物信息學分析。
2.2 GSE76293數據構成
芯片GSE76293的原始數據中包含2個部分共94個轉錄序列,A組為人體中取得的標本,B組為細胞學結果,選取A組分中12例ARDS患者(GSM1979240、242、244、246、248、250、252、254、256、258、230、232)和12例健康志愿者(HVT)(GSM1979241、243、245、247、249、251、253、255、257、259、231、233)的中性粒細胞的轉錄譜樣本,依次標記為ARDS1、2、3……12和HVT1、2、3……12[3]。使用R語言對原始數據進行標準化處理(圖1),標準化后各個樣本中位數位于同一水平線,數據具有可比性。圖2展示了所有樣本的基因表達情況。

a. 標準化前;b. 標準化后。

2.3 差異表達基因篩選
在線工具GEO2R共篩選得到113個差異表達基因,篩選去重后得到上調表達基因26個,下調表達基因60個(圖3,表1)。


2.4 PPI網絡和核心基因分析
將GEO2R篩選得到的86個差異表達基因上傳至STRING網址,共有81個基因納入PPI網絡分析,PPI網絡圖經設置參數后如圖4所示。進一步以Cytoscape軟件分析,得到11個樞紐基因,分別為AHSP、ALAS2、CD177、CLEC4D、EPB42、GPR84、HBD、HVCN1、KLF1、SLC4A1和STOM。

2.5 功能分析
以DAVID網站進行基因GO分析和KEGG通路富集分析。導入86個差異表達基因,富集分析結果見表2、3和圖5。差異基因的生物進程主要為細胞形狀調節、肽基酪氨酸磷酸化、通過MHCⅡ類分子進行抗原處理和呈遞等;細胞組成主要為膜的整體構件、質膜、細胞表面等;分子功能主要為蛋白同源二聚化活動、MHCⅡ類受體活動、多肽抗原結合、轉移酶活性及糖基轉移組等。分別選取在生物進程、細胞組成和分子功能上排名前5位的明顯富集基因,從疾病庫勾選GAD_DISEASE對應KEGG信號途徑,Kappa指數較高的通路為細胞因子–細胞因子受體間的相互作用和甲型流感病毒感染,其中CXCL8為兩者的共有關鍵基因。



a. 生物進程;b. 分子功能;c. 細胞組成;d. 通路富集。
3 討論
ARDS是一種受環境、遺傳等多因素影響的高度異質性的危重疾病,病死率居高不下,幸存者面臨后期肺組織逐步纖維化和肺功能難以恢復的困境[4]。因缺乏有效預測ARDS風險性和易感性的生物標志物,臨床試驗在ARDS患者中難以成功開展及評估,近年來也尚無新的疾病治療策略[5]。運用組學的方法可以對ARDS的發病機制有更全面的了解,以期尋找新的治療靶點。本研究選用的數據來自GSE76293 Part A部分,提取ARDS患者及在年齡、性別等配對的健康志愿者血漿中性粒細胞完成基因表達譜分析,因此可排除部分人口學相關混雜因素。
ARDS的病理特點為肺內中性粒細胞的活化、浸潤,中性粒細胞介導的炎癥反應是ARDS發生發展的中心環節。CXCL8,又稱白細胞介素-8,是中性粒細胞強有力的趨化因子。在Cytoscape分析樞紐基因時,可以發現CXCL8處于PPI網絡圖中較為中心的位置。但CXCL8并未處于樞紐基因的列表中,可能因其介導的中性粒細胞性炎癥反應并無特異性。既往從中性粒細胞活化后的各個階段進行干預均無良好的臨床獲益,故圍繞中性粒細胞的功能還需進行更深入的研究[6-7]。
除了炎癥反應,內皮細胞激活、上皮細胞功能障礙和表面活性物質耗竭也與ARDS發病密不可分[8-10]。血管內皮細胞及肺泡上皮細胞難以發揮正常的屏障和呼吸支持功能是ARDS患者低氧血癥難以糾正的重要原因,本研究進行基因功能富集時,細胞組成部分主要是質膜的完整性受到破壞。KEGG通路富集分析發現多條通路參與ARDS發病,而細胞因子受體通路為主要參與者。各種促炎細胞因子級聯放大的炎癥反應始終位于ARDS發病的核心地位,但這種炎癥反應沒有特異性,所以抗炎治療雖能縮短重癥加強治療病房入住時間,而臨床上并不能降低ARDS病死率[11]。參與ARDS發病的因素眾多,前期研究發現Th17細胞介導的免疫應答失衡是觸發中性粒細胞性炎癥反應的關鍵,或許可從源頭遏制炎癥反應的發生發展[12]。此外,KEGG富集到的Kappa指數最高的兩條通路中均有CXCL8參與,鎖定CXCL8的表達和功能不失為新的研究方向。
GPR家族是一種G蛋白偶聯受體,本研究中GPR84為11個樞紐基因之一,多分布在免疫細胞如巨噬細胞、T細胞等表面,通過調節二級信使觸發下游細胞內信號傳導[13]。GPR84的功能或仍為促進炎癥反應:激活GPR84后Akt通路磷酸化并伴促炎介質腫瘤壞死因子-α、白細胞介素(IL)-6、IL-12B、CCL2、CCL5和CXCL1高表達,敲除GPR84或使用抑制劑阻斷后上述炎癥反應明顯受抑[14]。有趣的是,GPR84僅能被中鏈脂肪酸激活,同時參與體內多種代謝途徑,敲除GPR84的老鼠同時存在線粒體代謝障礙和胰島素抵抗[15]。前期研究發現胰島素可通過mTORC2/SGK1通路上調Ⅱ型肺泡上皮細胞鈉離子通道表達,促進急性肺損傷小鼠肺泡間隔水腫液吸收,改善低氧血癥[16]。肥胖型患者罹患ARDS的風險增加,但死亡風險似乎更低[17-20]。我們推測脂肪代謝在ARDS發病發展中有雙重作用,后期擬通過深入研究GPR84的功能以闡釋這一“肥胖悖論”現象,并探尋新的治療靶點。
綜上所述,本研究通過生物信息學手段,得到11個樞紐基因或與ARDS的發病密切相關,結合課題組前期研究結果,著重介紹了CXCL8及GPR84的潛在研究價值。而GO分析和KEGG通路富集分析則更好的解釋了ARDS發病的相關機制,為科學研究提供了方向,有利于后期臨床試驗的展開,或為ARDS患者帶來新的希望。
利益沖突:本研究不涉及任何利益沖突。
自急性呼吸窘迫綜合征(ARDS)首次被描述的近50年來,通過對血漿及支氣管肺泡灌洗液中蛋白質差異表達的探索,對ARDS的研究在危險因素、致病因素以及表征模式方面取得了實質性進展,但仍未發現有顯著降低ARDS患者病死率的“神奇”藥物。其原因與ARDS患者不同炎癥狀態的異質性、對不同藥物的反應性等相關[1]。氣道內中性粒細胞積累導致活性氧、細胞因子、蛋白酶、中性粒細胞胞外誘捕網釋放,為ARDS患者發生肺組織損傷的主要元兇。但由于分離臨床樣本中肺泡中性粒細胞困難大,中性粒細胞在ARDS中的功能活動是否存在差異鮮有報道,其分化表型是否存在異質性也少見研究涉獵[2]。隨著基因組學和信息技術的發展,對疾病表型和差異基因的解讀更深入,也為ARDS患者的精準治療帶來希望。藉此,本研究擬通過生物信息分析手段,從ARDS可能的發病機制入手,提供潛在的治療靶點以供參考。
1 材料與方法
1.1 芯片數據收集
基于Pubmed-NCBI網站(
1.2 差異基因篩選
以在線工具GEO2R(
1.3 蛋白質–蛋白質相互作用網絡分析
將1.2所獲得的差異基因導入在線分析工具STRING version 11.0(
1.4 核心基因分析
從STRING下載PPI分析時產生的TSV文件導入Cytoscape軟件3.7.2(美國國家普通醫學科學研究所開發),使用MCODE插件進一步分析核心基因。
1.5 基因功能分析
將GEO2R篩選出來的差異表達基因導入DAVID功能分析網站(
2 結果
2.1 篩選獲得GSE76293
在GEO數據庫中以Series,Expression profiling by array和Homo sapiens為限定條件,ARDS為檢索詞,獲得12條結果。Juss等[3]進行了一項關于磷酸肌醇3-激酶抑制ARDS中中性粒細胞敏感性的研究。該研究比較了ARDS患者與資料匹配的健康志愿者的中性粒細胞轉錄譜差異,是進一步挖掘中性粒細胞功能的理想選擇,故我們選擇該研究相關的芯片GSE76293數據進行生物信息學分析。
2.2 GSE76293數據構成
芯片GSE76293的原始數據中包含2個部分共94個轉錄序列,A組為人體中取得的標本,B組為細胞學結果,選取A組分中12例ARDS患者(GSM1979240、242、244、246、248、250、252、254、256、258、230、232)和12例健康志愿者(HVT)(GSM1979241、243、245、247、249、251、253、255、257、259、231、233)的中性粒細胞的轉錄譜樣本,依次標記為ARDS1、2、3……12和HVT1、2、3……12[3]。使用R語言對原始數據進行標準化處理(圖1),標準化后各個樣本中位數位于同一水平線,數據具有可比性。圖2展示了所有樣本的基因表達情況。

a. 標準化前;b. 標準化后。

2.3 差異表達基因篩選
在線工具GEO2R共篩選得到113個差異表達基因,篩選去重后得到上調表達基因26個,下調表達基因60個(圖3,表1)。


2.4 PPI網絡和核心基因分析
將GEO2R篩選得到的86個差異表達基因上傳至STRING網址,共有81個基因納入PPI網絡分析,PPI網絡圖經設置參數后如圖4所示。進一步以Cytoscape軟件分析,得到11個樞紐基因,分別為AHSP、ALAS2、CD177、CLEC4D、EPB42、GPR84、HBD、HVCN1、KLF1、SLC4A1和STOM。

2.5 功能分析
以DAVID網站進行基因GO分析和KEGG通路富集分析。導入86個差異表達基因,富集分析結果見表2、3和圖5。差異基因的生物進程主要為細胞形狀調節、肽基酪氨酸磷酸化、通過MHCⅡ類分子進行抗原處理和呈遞等;細胞組成主要為膜的整體構件、質膜、細胞表面等;分子功能主要為蛋白同源二聚化活動、MHCⅡ類受體活動、多肽抗原結合、轉移酶活性及糖基轉移組等。分別選取在生物進程、細胞組成和分子功能上排名前5位的明顯富集基因,從疾病庫勾選GAD_DISEASE對應KEGG信號途徑,Kappa指數較高的通路為細胞因子–細胞因子受體間的相互作用和甲型流感病毒感染,其中CXCL8為兩者的共有關鍵基因。



a. 生物進程;b. 分子功能;c. 細胞組成;d. 通路富集。
3 討論
ARDS是一種受環境、遺傳等多因素影響的高度異質性的危重疾病,病死率居高不下,幸存者面臨后期肺組織逐步纖維化和肺功能難以恢復的困境[4]。因缺乏有效預測ARDS風險性和易感性的生物標志物,臨床試驗在ARDS患者中難以成功開展及評估,近年來也尚無新的疾病治療策略[5]。運用組學的方法可以對ARDS的發病機制有更全面的了解,以期尋找新的治療靶點。本研究選用的數據來自GSE76293 Part A部分,提取ARDS患者及在年齡、性別等配對的健康志愿者血漿中性粒細胞完成基因表達譜分析,因此可排除部分人口學相關混雜因素。
ARDS的病理特點為肺內中性粒細胞的活化、浸潤,中性粒細胞介導的炎癥反應是ARDS發生發展的中心環節。CXCL8,又稱白細胞介素-8,是中性粒細胞強有力的趨化因子。在Cytoscape分析樞紐基因時,可以發現CXCL8處于PPI網絡圖中較為中心的位置。但CXCL8并未處于樞紐基因的列表中,可能因其介導的中性粒細胞性炎癥反應并無特異性。既往從中性粒細胞活化后的各個階段進行干預均無良好的臨床獲益,故圍繞中性粒細胞的功能還需進行更深入的研究[6-7]。
除了炎癥反應,內皮細胞激活、上皮細胞功能障礙和表面活性物質耗竭也與ARDS發病密不可分[8-10]。血管內皮細胞及肺泡上皮細胞難以發揮正常的屏障和呼吸支持功能是ARDS患者低氧血癥難以糾正的重要原因,本研究進行基因功能富集時,細胞組成部分主要是質膜的完整性受到破壞。KEGG通路富集分析發現多條通路參與ARDS發病,而細胞因子受體通路為主要參與者。各種促炎細胞因子級聯放大的炎癥反應始終位于ARDS發病的核心地位,但這種炎癥反應沒有特異性,所以抗炎治療雖能縮短重癥加強治療病房入住時間,而臨床上并不能降低ARDS病死率[11]。參與ARDS發病的因素眾多,前期研究發現Th17細胞介導的免疫應答失衡是觸發中性粒細胞性炎癥反應的關鍵,或許可從源頭遏制炎癥反應的發生發展[12]。此外,KEGG富集到的Kappa指數最高的兩條通路中均有CXCL8參與,鎖定CXCL8的表達和功能不失為新的研究方向。
GPR家族是一種G蛋白偶聯受體,本研究中GPR84為11個樞紐基因之一,多分布在免疫細胞如巨噬細胞、T細胞等表面,通過調節二級信使觸發下游細胞內信號傳導[13]。GPR84的功能或仍為促進炎癥反應:激活GPR84后Akt通路磷酸化并伴促炎介質腫瘤壞死因子-α、白細胞介素(IL)-6、IL-12B、CCL2、CCL5和CXCL1高表達,敲除GPR84或使用抑制劑阻斷后上述炎癥反應明顯受抑[14]。有趣的是,GPR84僅能被中鏈脂肪酸激活,同時參與體內多種代謝途徑,敲除GPR84的老鼠同時存在線粒體代謝障礙和胰島素抵抗[15]。前期研究發現胰島素可通過mTORC2/SGK1通路上調Ⅱ型肺泡上皮細胞鈉離子通道表達,促進急性肺損傷小鼠肺泡間隔水腫液吸收,改善低氧血癥[16]。肥胖型患者罹患ARDS的風險增加,但死亡風險似乎更低[17-20]。我們推測脂肪代謝在ARDS發病發展中有雙重作用,后期擬通過深入研究GPR84的功能以闡釋這一“肥胖悖論”現象,并探尋新的治療靶點。
綜上所述,本研究通過生物信息學手段,得到11個樞紐基因或與ARDS的發病密切相關,結合課題組前期研究結果,著重介紹了CXCL8及GPR84的潛在研究價值。而GO分析和KEGG通路富集分析則更好的解釋了ARDS發病的相關機制,為科學研究提供了方向,有利于后期臨床試驗的展開,或為ARDS患者帶來新的希望。
利益沖突:本研究不涉及任何利益沖突。