引用本文: 趙桐, 王怡云, 關菲, 李耕旭, 李世峰. 難治性哮喘患兒外周血關鍵基因的篩選、驗證和診斷價值分析. 華西醫學, 2023, 38(2): 270-277. doi: 10.7507/1002-0179.202202014 復制
哮喘是一種以氣道炎癥和高反應性為特征的復雜炎癥性疾病,是兒童期最常見的慢性疾病之一。中國兒科哮喘協作組對 0~14 歲兒童哮喘患病率進行的全國范圍內大規模隊列研究顯示,1990 年、2000 年和 2010 年兒童哮喘全國患病率分別為 0.91%、1.54% 和 2.32%[1],且隨著快速的工業化、環境和生活方式的變化,哮喘的發病率逐年增加,是兒童輟學的重要原因之一,極大影響患者的身體和心理發育[2]。研究顯示,約 5% 的哮喘兒童盡管使用大劑量吸入皮質類固醇或口服皮質類固醇進行治療,但哮喘癥狀仍持續甚至逐漸加重,稱為兒童難治性哮喘或重型哮喘(severe asthma, SA)[3]。盡管該類哮喘比重較小,卻占哮喘相關總支出的 50%[4],且癥狀的持續和惡化可能導致不良預后,甚至危及患兒生命[5],因此,深入研究難治性哮喘的發病機制,挖掘難治性哮喘的關鍵診療靶點和靶向藥物,具有重要意義,也是哮喘的基礎和臨床研究中亟待解決的重點和難點問題。
基于測序和芯片技術的組學測序可以對機體生理狀態、病理狀態或者一個細胞表型有關的基因進行系統監控,在疾病機制探索、疾病診斷標志物的篩選和治療靶點的挖掘中發揮了重要的作用。在以往針對哮喘的研究中,學者們采用檢測患兒鼻腔灌洗液、支氣管肺泡灌洗液樣本,或支氣管鏡引導下的氣道上皮細胞及肺組織樣本,發現了一系列哮喘相關生物標志物[6]。外周血細胞獲取方便、安全、成本低,是分析兒童基因表達譜的理想替代品[7]。本研究以高通量基因表達(Gene Expression Omnibus, GEO)數據庫下載的外周血單個核細胞轉錄組測序數據為研究對象,采用多重生物信息學技術方法篩選難治性哮喘的關鍵基因,并通過臨床樣本驗證,分析關鍵基因在難治性哮喘中的表達和臨床意義,為難治性哮喘的臨床診治提供理論依據。現報告如下。
1 資料與方法
1.1 數據集和生物信息學分析
1.1.1 數據集獲取
為了分析兒童 SA 的關鍵基因,截止至 2019 年 8 月 20 日,在 GEO 數據庫[8]里搜索“therapy-resistant asthma AND children”,獲得數據集 GSE27011。該數據集為兒童外周血單個核細胞樣本的基因芯片數據,包括 54 例樣本,其中男 37 例,女 17 例;平均年齡為(12.32±3.98)歲;將數據集 GSE27011 中的樣本分為健康對照組、輕度哮喘(mild asthma, MA)組、SA 組 3 組。通過網絡下載獲得基因表達譜數據和 Affymetrix 公司 GPL6244 平臺的芯片注釋文件。同時下載哮喘相關轉錄組數據集:健康、MA、SA 兒童的外周血數據集(GSE207751)、SA 患兒恢復期和急性發作期外周血(GSE16032)、過敏性哮喘肺嗜酸性粒細胞(GSE57757)、哮喘外周的巨噬細胞(GSE477)、CD4+/CD8+ T 細胞(GSE31773),數據集內容見 GEO 數據庫 https://www.ncbi.nlm.nih.gov/geo/。
1.1.2 生物信息學分析
采用 R 軟件的 limma 包[9]對基因表達矩陣進行多組間差異分析,采用 GOplot 包[10]對差異分析結果進行可視化。采用 Mfuzz 包[11]對差異基因進行表達分層分析,獲得差異基因在 3 組間的表達趨勢。
采用加權基因共表達網絡分析(weighted gene co-expression network analysis, WGCNA)包[12]構建基因共表達網絡,步驟包括:確定軟閾值、驗證無處度網絡、動態剪切樹算法構建基因共表達模塊、模塊基因構建拓撲矩陣、模塊相關性分析、模塊與臨床信息相關性分析。將 SA 組顯著升高的基因群與 SA 組相關性最高的基因模塊取交集,繪制韋恩圖,獲得關鍵基因 GNA15。
1.2 臨床研究和分析
1.2.1 臨床研究對象
選擇 2020 年 9 月—2021 年 9 月在唐山市人民醫院兒科確診的 78 例哮喘患兒為研究對象。納入標準:符合中華醫學會兒科學分會呼吸學制定的《兒童支氣管哮喘規范化診治建議(2020 年版)》[13]診斷標準。選擇同期體檢的 30 例非哮喘兒童為對照組。哮喘患兒與非哮喘兒童的排除標準(滿足如下一條及以上):① 納入前 2 個月內使用激素;② 急性感染性疾病;③ 伴有其他過敏性疾病;④ 先天性的心肺疾病、呼吸系統、神經系統、運動系統疾病等;⑤ 臨床資料不完整;⑥ 非哮喘引起咳嗽、呼吸困難和喘息等癥狀的疾病;⑦ 未控制的與哮喘無關的并存疾病。本研究通過唐山市人民醫院倫理委員會審核(RMYY-LLKS-2021-001),獲得兒童家屬的知情同意。
1.2.2 分組
共納入哮喘患兒 78 例,根據其哮喘癥狀分為 2 組:SA 組[共 28 例,男 17 例,女 11 例,平均年齡為(7.35±2.37)歲]和 MA 組[共 50 例,男 31 例,女 19 例,平均年齡為(6.88±2.34)歲]。共納入非哮喘兒童(對照組)30 例,男 18 例,女 12 例,平均年齡為(6.73±2.49)歲。
組別定義:對照組為健康兒童(非哮喘兒童);MA 是指對常規抗哮喘藥物治療敏感的哮喘患兒;SA 是指雖然接受糖皮質激素吸入藥物的聯合用藥方案治療,仍未達到良好控制的哮喘患兒。
1.2.3 反轉錄-聚合酶鏈反應檢測
收集兒童晨起空腹肘靜脈血液樣本 2 mL,采用密度梯度離心法分離單個核細胞。TRIzol?試劑盒提取總 RNA(美國 Invitrogen 公司),依次進行逆轉錄(北京寶日醫 TaKaRa 生物技術有限公司)、聚合酶鏈反應。根據 ΔΔCt 法計算甘油醛-3-磷酸脫氫酶與 GNA15 的 mRNA 的相對水平。GNA15的 RNA 引物-正向:5’‐CTA CCA GAA CAT CTT CGT GTC CAT‐3’;反向:5’‐GCT GAA TCG AGC AGG TGG AA‐3’。
1.2.4 血清學檢測
收集兒童晨起空腹肘靜脈血液樣本 2 mL 置于非抗凝管,4℃放置 2 h,1 000 r/min 離心 15 min,獲得血清。采用酶聯免疫吸附試驗試劑盒(南京建成生物工程研究所)檢測血清白細胞介素(interleukin, IL)-4 和 IL-17 的蛋白表達水平。
1.3 統計學方法
采用 SPSS 22.0 統計學軟件對數據進行分析。符合正態分布的計量資料采用均數±標準差表示,醫院患兒樣本、數據集 GSE27011 樣本、數據集 GSE207751 樣本、CD4+/CD8+ T 細胞(GSE31773)樣本中,3 組樣本的組間比較采用單因素方差分析,組間兩兩比較采用 SNK 檢驗。數據集 GSE16032 樣本、數據集 GSE57757 樣本和數據集 GSE477 樣本,2 組之間樣本的均數比較采用 t 檢驗。計數資料采用頻數表示。采用受試者工作特征(receiver operating characteristic, ROC)曲線評估血液 GNA15、IL-4、IL-17 預測兒童 SA 的敏感性、特異性和準確度。雙側檢驗水準 α=0.05。
2 結果
2.1 生物信息學分析結果
2.1.1 GSE27011 數據集中差異基因在 3 組間的表達趨勢
根據基因在對照組、MA 組和 SA 組之間表達的趨勢特點,將基因分群,結果顯示,差異基因在對照組、MA 組和 SA 組之間形成 6 種表達模式群集。第 1 群集基因在對照組、MA 組和 SA 組之間呈顯著降低和顯著升高的趨勢;第 2 群集基因在對照組、MA 組和 SA 組之間呈輕微升高和顯著降低的趨勢;第 3 群集基因在對照組、MA 組和 SA 組之間呈逐漸升高的趨勢;第 4 群集、第 5 群集和第 6 群集基因在對照組、MA 組和 SA 組之間表達趨勢分別與第 1 群集、第 2 群集和第 3 群集趨勢相反。見圖1。

a. 第 1 群集;b. 第 2 群集;c. 第 3 群集;d. 第 4 群集;e. 第 5 群集;f. 第 6 群集
2.1.2 WGCNA 分析共表達基因模塊和與臨床信息相關性分析
采用 WGCNA 分析 GSE27011 數據集中 3 組基因的共表達的基因模塊,當軟閾值取 10 時,R2>0.8,且此時基因共表達符合無尺度網絡(圖2)。通過動態剪切樹算法獲得 18 個拓撲重疊的基因共表達模塊(圖3),其中灰色模塊包含的基因未納入分析。模塊基因進行拓撲分析,結果顯示同一模塊內的基因具有較好的相關性(圖4)。基因共表達模塊與臨床信息相關性分析結果顯示,藍色模塊與 MA 相關性最高(r=0.53,P<0.001),寶藍色模塊與 SA 相關度最好(r=0.47,P<0.001),見圖5。

a. 尺度獨立性,顯示無標度擬合指數(

根據基因相似性進行層次聚類構建的樹狀圖,縱坐標為基因之間的相似性,樹狀圖的下半部分為基因模塊,具有共表達特點的基因束用一種隨機顏色模塊表示,形成動態剪切樹。將相似度大于 75% 的基因束整合為最終的基因表達模塊,用隨機顏色表示,形成合并的動態剪切樹

縱坐標顏色模塊為與圖3 中合并的動態剪切樹對應的不同基因模塊;熱圖相關程度的標尺采用藍色到紅色的過渡顏色,正相關的關系用紅色表示,負相關的關系用藍色表示;熱圖中的數值代表基因集模塊與分組的相關性,對應的顏色為相關性數值換算為標尺中的顏色
2.1.3 關鍵基因的確定
由于第 5 群集的基因的表達水平僅在 SA 組顯著升高,而在 MA 組表達水平與對照組相比略降低,因此,第 5 群集的基因的表達可能對 SA 的診斷特異性更高,另外,WGCNA 分析發現寶藍色基因模塊內基因與 SA 的相關性更高,因此,將第 5 群集的基因與寶藍色基因模塊基因取交集,獲得了關鍵基因 GNA15,見圖6。

韋恩圖中的數字為該基因集中的基因數。其中,3 594 表示僅在第 5 群集中的基因,95 表示僅在寶藍色基因模塊中的基因,1 表示第 5 群集與寶藍色模塊的交集基因
2.1.4 哮喘患兒、小鼠模型和免疫細胞數據集中 GNA15 基因的表達
進一步驗證 GNA15 基因在哮喘相關驗證數據集 GSE207751,以及 SA 患兒恢復期和急性發作期外周血中的表達(GSE16032)。由圖7 可見,GNA15 基因在健康兒童和 MA 患兒外周血中的表達水平無差異,而在 SA 患兒外周血中 GNA15 的表達水平與對照組相比顯著上調;另外,GNA15 基因在 SA 患兒急性加重期患兒的外周血中與恢復期相比顯著高表達,均顯著表達上調,差異具有統計學意義(P<0.05)。

a. 兒童外周血 GSE207751;b. SA 哮喘患兒 GSE16032;c. 嗜酸性粒細胞 GSE57757;d. 巨噬細胞 GSE477;e. CD4+ T GSE31773;f. CD8+ T GSE31773。*組間比較,
哮喘模型免疫細胞轉錄組數據集分析結果顯示,GNA15 基因在過敏性哮喘肺嗜酸性粒細胞中表達與非哮喘組相比表達上調(GSE57757),然而,在哮喘與非哮喘組外周的巨噬細胞(GSE477)、CD4+/CD8+ T 細胞(GSE31773)中 GNA15 基因表達水平無差異(P>0.05)。
2.2 臨床研究結果
2.2.1 醫院收集正常和哮喘兒童血清學檢測結果
3 組間的 IL-4、IL-17 的蛋白含量和 GNA15 的 mRNA 含量比較,差異均有統計學意義(P<0.05)。組間兩兩比較結果顯示:與對照組比較,MA 組和 SA 組的 IL-4 和 IL-17 的蛋白含量均上調(P<0.05);IL-4 和 IL-17 的蛋白含量在 MA 組與 SA 組之間比較,差異無統計學意義(P>0.05);對照組與 MA 組的 GNA15 的 mRNA 含量比較,差異無統計學意義(P>0.05);SA 組的 GNA15 的 mRNA 含量高于 MA 組和對照組(P<0.05)。見表1。


2.2.2 兒童外周血 GNA15、IL-4、IL-17 預測 SA
ROC 曲線分析顯示,GNA15、IL-4 和 IL-17 預測兒童 SA 的曲線下面積(area under curve, AUC)分別為 0.861、0.760 和 0.818,靈敏度分別為 0.800、0.933 和 0.900,特異度分別為 0.929、0.607 和 0.607(P<0.05),見表2、圖8。


3 討論
哮喘目前被廣泛認為是一種異質性疾病,其中 SA 患兒由于癥狀的持續和惡化,且對藥物治療不敏感,預后較差,因此亟待挖掘 SA 的關鍵診療靶點。為了篩選 SA 患兒特異性診斷標志物,本研究分析了外周血單個核細胞的轉錄組測序數據,并通過基因表達分層分析和 WGCNA[12]分析兩組生物信息學算法,獲得 SA 患兒表達顯著上調且與 SA 患兒相關性最高的關鍵基因 GNA15。綜合生物信息學分析結果提示,GNA15 基因表達上調可能對難治性哮喘具有重要的臨床參考價值。
本課題組近期研究發現,GNA15 基因具有較好的預測 SA 哮喘預后的潛能[14]。然而,GNA15 的診斷價值以及相關機制仍不清楚。本研究驗證了 GNA15 基因在另一組 SA 患兒外周血以及 SA 患兒急性加重期和恢復期中的表達情況,發現 GNA15 基因在 SA 患兒外周血中顯著上調,且在急性加重期患兒的外周血中顯著上調。GNA15 基因編碼的 Gα15 蛋白屬于 Gα 蛋白 q 亞家族成員之一,其最早被報道為造血組織和肺組織特異性基因[15]。研究顯示,GNA15 與免疫系統關系密切,可維持補體 C5a 功能,調控巨噬細胞活化[16-17]。哮喘相關氣道炎癥多由嗜酸性粒細胞、肥大細胞、T 淋巴細胞、中性粒細胞等多種免疫細胞組分參與。研究顯示,兒童外周血中免疫細胞構成比、極化狀態也表型的差異可影響哮喘患兒對糖皮質激素的敏感性,這可能是兒童發展為 SA 的重要原因[18]。
轉錄組學和臨床研究表明,SA 的發病機制主要涉及 CD4+的輔助型 T 淋巴細胞(Th2)驅動的免疫通路活化,并釋放 IL-4 等炎癥因子,引起氣道重塑[19]。另一類 SA 哮喘表現為中性粒細胞介導的 IL-17 釋放,通過上調 CXC 趨化因子配體(CXC-chemokine ligand,CXCL)1、CXCL 8 和 IL-6 等因子,誘導氣道高反應[20]。因此,臨床上常將血清學 IL-4 和 IL-17 的含量作為哮喘的常規檢測指標。本研究將 GNA15 的表達特點與哮喘常規炎性標志物 IL-4、IL-17 對比,發現 GNA15 僅在 SA 哮喘患兒外周血單個核細胞中特異性高表達,這表明 GNA15 能較好區分 MA 和 SA,即可以較好地判斷哮喘兒童病情的嚴重程度。另外,本研究還分析比較了 GNA15、IL-4 和 IL-17 作為預測兒童 SA 的診斷價值,發現 GNA15 評價 SA 的特異性和準確度均優于 IL-4 和 IL-17。然而,GNA15 基因在哮喘疾病中參與調控何種炎癥細胞,目前未見文獻報道。為此,本研究進一步驗證了 GNA15 基因在哮喘相關炎癥細胞中的表達情況,發現 GNA15 基因在巨噬細胞、CD4+ T 細胞和 CD8+ T 細胞中表達與對照組無差異,而僅在嗜酸性粒細胞中表達顯著上調。一項隊列研究發現,外周嗜酸性粒細胞對兒童和成年哮喘急性加重具有重要的意義[21],為此,大多數研究將兒童 SA 的治療靶點聚焦于嗜酸性粒細胞[22-23],并發現貝那利珠單抗(Benralizumab)[24]、度普利尤單抗(Dupilumab)[25-26]等嗜酸性粒細胞靶向抑制藥對 SA 患兒具有很好的治療效果和安全性。并且,外周血嗜酸性粒細胞計數與痰液或者肺組織嗜酸性粒細胞計數相比,具有更好的監測哮喘患者對藥物治療的敏感性[23]。本研究發現 GNA15 特異性地高表達于嗜酸性粒細胞,以 GNA15 基因為切入點,進一步補充了嗜酸性粒細胞對 SA 患兒急性加重的潛在診斷價值。然而,本研究的結果仍需要更多的基礎研究,深入探索 GNA15 調節嗜酸性粒細胞影響哮喘的機制。
綜上所述,外周血 GNA15 在診斷兒童哮喘嚴重程度方面具有一定的臨床價值。
利益沖突:所有作者聲明不存在利益沖突。
哮喘是一種以氣道炎癥和高反應性為特征的復雜炎癥性疾病,是兒童期最常見的慢性疾病之一。中國兒科哮喘協作組對 0~14 歲兒童哮喘患病率進行的全國范圍內大規模隊列研究顯示,1990 年、2000 年和 2010 年兒童哮喘全國患病率分別為 0.91%、1.54% 和 2.32%[1],且隨著快速的工業化、環境和生活方式的變化,哮喘的發病率逐年增加,是兒童輟學的重要原因之一,極大影響患者的身體和心理發育[2]。研究顯示,約 5% 的哮喘兒童盡管使用大劑量吸入皮質類固醇或口服皮質類固醇進行治療,但哮喘癥狀仍持續甚至逐漸加重,稱為兒童難治性哮喘或重型哮喘(severe asthma, SA)[3]。盡管該類哮喘比重較小,卻占哮喘相關總支出的 50%[4],且癥狀的持續和惡化可能導致不良預后,甚至危及患兒生命[5],因此,深入研究難治性哮喘的發病機制,挖掘難治性哮喘的關鍵診療靶點和靶向藥物,具有重要意義,也是哮喘的基礎和臨床研究中亟待解決的重點和難點問題。
基于測序和芯片技術的組學測序可以對機體生理狀態、病理狀態或者一個細胞表型有關的基因進行系統監控,在疾病機制探索、疾病診斷標志物的篩選和治療靶點的挖掘中發揮了重要的作用。在以往針對哮喘的研究中,學者們采用檢測患兒鼻腔灌洗液、支氣管肺泡灌洗液樣本,或支氣管鏡引導下的氣道上皮細胞及肺組織樣本,發現了一系列哮喘相關生物標志物[6]。外周血細胞獲取方便、安全、成本低,是分析兒童基因表達譜的理想替代品[7]。本研究以高通量基因表達(Gene Expression Omnibus, GEO)數據庫下載的外周血單個核細胞轉錄組測序數據為研究對象,采用多重生物信息學技術方法篩選難治性哮喘的關鍵基因,并通過臨床樣本驗證,分析關鍵基因在難治性哮喘中的表達和臨床意義,為難治性哮喘的臨床診治提供理論依據。現報告如下。
1 資料與方法
1.1 數據集和生物信息學分析
1.1.1 數據集獲取
為了分析兒童 SA 的關鍵基因,截止至 2019 年 8 月 20 日,在 GEO 數據庫[8]里搜索“therapy-resistant asthma AND children”,獲得數據集 GSE27011。該數據集為兒童外周血單個核細胞樣本的基因芯片數據,包括 54 例樣本,其中男 37 例,女 17 例;平均年齡為(12.32±3.98)歲;將數據集 GSE27011 中的樣本分為健康對照組、輕度哮喘(mild asthma, MA)組、SA 組 3 組。通過網絡下載獲得基因表達譜數據和 Affymetrix 公司 GPL6244 平臺的芯片注釋文件。同時下載哮喘相關轉錄組數據集:健康、MA、SA 兒童的外周血數據集(GSE207751)、SA 患兒恢復期和急性發作期外周血(GSE16032)、過敏性哮喘肺嗜酸性粒細胞(GSE57757)、哮喘外周的巨噬細胞(GSE477)、CD4+/CD8+ T 細胞(GSE31773),數據集內容見 GEO 數據庫 https://www.ncbi.nlm.nih.gov/geo/。
1.1.2 生物信息學分析
采用 R 軟件的 limma 包[9]對基因表達矩陣進行多組間差異分析,采用 GOplot 包[10]對差異分析結果進行可視化。采用 Mfuzz 包[11]對差異基因進行表達分層分析,獲得差異基因在 3 組間的表達趨勢。
采用加權基因共表達網絡分析(weighted gene co-expression network analysis, WGCNA)包[12]構建基因共表達網絡,步驟包括:確定軟閾值、驗證無處度網絡、動態剪切樹算法構建基因共表達模塊、模塊基因構建拓撲矩陣、模塊相關性分析、模塊與臨床信息相關性分析。將 SA 組顯著升高的基因群與 SA 組相關性最高的基因模塊取交集,繪制韋恩圖,獲得關鍵基因 GNA15。
1.2 臨床研究和分析
1.2.1 臨床研究對象
選擇 2020 年 9 月—2021 年 9 月在唐山市人民醫院兒科確診的 78 例哮喘患兒為研究對象。納入標準:符合中華醫學會兒科學分會呼吸學制定的《兒童支氣管哮喘規范化診治建議(2020 年版)》[13]診斷標準。選擇同期體檢的 30 例非哮喘兒童為對照組。哮喘患兒與非哮喘兒童的排除標準(滿足如下一條及以上):① 納入前 2 個月內使用激素;② 急性感染性疾病;③ 伴有其他過敏性疾病;④ 先天性的心肺疾病、呼吸系統、神經系統、運動系統疾病等;⑤ 臨床資料不完整;⑥ 非哮喘引起咳嗽、呼吸困難和喘息等癥狀的疾病;⑦ 未控制的與哮喘無關的并存疾病。本研究通過唐山市人民醫院倫理委員會審核(RMYY-LLKS-2021-001),獲得兒童家屬的知情同意。
1.2.2 分組
共納入哮喘患兒 78 例,根據其哮喘癥狀分為 2 組:SA 組[共 28 例,男 17 例,女 11 例,平均年齡為(7.35±2.37)歲]和 MA 組[共 50 例,男 31 例,女 19 例,平均年齡為(6.88±2.34)歲]。共納入非哮喘兒童(對照組)30 例,男 18 例,女 12 例,平均年齡為(6.73±2.49)歲。
組別定義:對照組為健康兒童(非哮喘兒童);MA 是指對常規抗哮喘藥物治療敏感的哮喘患兒;SA 是指雖然接受糖皮質激素吸入藥物的聯合用藥方案治療,仍未達到良好控制的哮喘患兒。
1.2.3 反轉錄-聚合酶鏈反應檢測
收集兒童晨起空腹肘靜脈血液樣本 2 mL,采用密度梯度離心法分離單個核細胞。TRIzol?試劑盒提取總 RNA(美國 Invitrogen 公司),依次進行逆轉錄(北京寶日醫 TaKaRa 生物技術有限公司)、聚合酶鏈反應。根據 ΔΔCt 法計算甘油醛-3-磷酸脫氫酶與 GNA15 的 mRNA 的相對水平。GNA15的 RNA 引物-正向:5’‐CTA CCA GAA CAT CTT CGT GTC CAT‐3’;反向:5’‐GCT GAA TCG AGC AGG TGG AA‐3’。
1.2.4 血清學檢測
收集兒童晨起空腹肘靜脈血液樣本 2 mL 置于非抗凝管,4℃放置 2 h,1 000 r/min 離心 15 min,獲得血清。采用酶聯免疫吸附試驗試劑盒(南京建成生物工程研究所)檢測血清白細胞介素(interleukin, IL)-4 和 IL-17 的蛋白表達水平。
1.3 統計學方法
采用 SPSS 22.0 統計學軟件對數據進行分析。符合正態分布的計量資料采用均數±標準差表示,醫院患兒樣本、數據集 GSE27011 樣本、數據集 GSE207751 樣本、CD4+/CD8+ T 細胞(GSE31773)樣本中,3 組樣本的組間比較采用單因素方差分析,組間兩兩比較采用 SNK 檢驗。數據集 GSE16032 樣本、數據集 GSE57757 樣本和數據集 GSE477 樣本,2 組之間樣本的均數比較采用 t 檢驗。計數資料采用頻數表示。采用受試者工作特征(receiver operating characteristic, ROC)曲線評估血液 GNA15、IL-4、IL-17 預測兒童 SA 的敏感性、特異性和準確度。雙側檢驗水準 α=0.05。
2 結果
2.1 生物信息學分析結果
2.1.1 GSE27011 數據集中差異基因在 3 組間的表達趨勢
根據基因在對照組、MA 組和 SA 組之間表達的趨勢特點,將基因分群,結果顯示,差異基因在對照組、MA 組和 SA 組之間形成 6 種表達模式群集。第 1 群集基因在對照組、MA 組和 SA 組之間呈顯著降低和顯著升高的趨勢;第 2 群集基因在對照組、MA 組和 SA 組之間呈輕微升高和顯著降低的趨勢;第 3 群集基因在對照組、MA 組和 SA 組之間呈逐漸升高的趨勢;第 4 群集、第 5 群集和第 6 群集基因在對照組、MA 組和 SA 組之間表達趨勢分別與第 1 群集、第 2 群集和第 3 群集趨勢相反。見圖1。

a. 第 1 群集;b. 第 2 群集;c. 第 3 群集;d. 第 4 群集;e. 第 5 群集;f. 第 6 群集
2.1.2 WGCNA 分析共表達基因模塊和與臨床信息相關性分析
采用 WGCNA 分析 GSE27011 數據集中 3 組基因的共表達的基因模塊,當軟閾值取 10 時,R2>0.8,且此時基因共表達符合無尺度網絡(圖2)。通過動態剪切樹算法獲得 18 個拓撲重疊的基因共表達模塊(圖3),其中灰色模塊包含的基因未納入分析。模塊基因進行拓撲分析,結果顯示同一模塊內的基因具有較好的相關性(圖4)。基因共表達模塊與臨床信息相關性分析結果顯示,藍色模塊與 MA 相關性最高(r=0.53,P<0.001),寶藍色模塊與 SA 相關度最好(r=0.47,P<0.001),見圖5。

a. 尺度獨立性,顯示無標度擬合指數(

根據基因相似性進行層次聚類構建的樹狀圖,縱坐標為基因之間的相似性,樹狀圖的下半部分為基因模塊,具有共表達特點的基因束用一種隨機顏色模塊表示,形成動態剪切樹。將相似度大于 75% 的基因束整合為最終的基因表達模塊,用隨機顏色表示,形成合并的動態剪切樹

縱坐標顏色模塊為與圖3 中合并的動態剪切樹對應的不同基因模塊;熱圖相關程度的標尺采用藍色到紅色的過渡顏色,正相關的關系用紅色表示,負相關的關系用藍色表示;熱圖中的數值代表基因集模塊與分組的相關性,對應的顏色為相關性數值換算為標尺中的顏色
2.1.3 關鍵基因的確定
由于第 5 群集的基因的表達水平僅在 SA 組顯著升高,而在 MA 組表達水平與對照組相比略降低,因此,第 5 群集的基因的表達可能對 SA 的診斷特異性更高,另外,WGCNA 分析發現寶藍色基因模塊內基因與 SA 的相關性更高,因此,將第 5 群集的基因與寶藍色基因模塊基因取交集,獲得了關鍵基因 GNA15,見圖6。

韋恩圖中的數字為該基因集中的基因數。其中,3 594 表示僅在第 5 群集中的基因,95 表示僅在寶藍色基因模塊中的基因,1 表示第 5 群集與寶藍色模塊的交集基因
2.1.4 哮喘患兒、小鼠模型和免疫細胞數據集中 GNA15 基因的表達
進一步驗證 GNA15 基因在哮喘相關驗證數據集 GSE207751,以及 SA 患兒恢復期和急性發作期外周血中的表達(GSE16032)。由圖7 可見,GNA15 基因在健康兒童和 MA 患兒外周血中的表達水平無差異,而在 SA 患兒外周血中 GNA15 的表達水平與對照組相比顯著上調;另外,GNA15 基因在 SA 患兒急性加重期患兒的外周血中與恢復期相比顯著高表達,均顯著表達上調,差異具有統計學意義(P<0.05)。

a. 兒童外周血 GSE207751;b. SA 哮喘患兒 GSE16032;c. 嗜酸性粒細胞 GSE57757;d. 巨噬細胞 GSE477;e. CD4+ T GSE31773;f. CD8+ T GSE31773。*組間比較,
哮喘模型免疫細胞轉錄組數據集分析結果顯示,GNA15 基因在過敏性哮喘肺嗜酸性粒細胞中表達與非哮喘組相比表達上調(GSE57757),然而,在哮喘與非哮喘組外周的巨噬細胞(GSE477)、CD4+/CD8+ T 細胞(GSE31773)中 GNA15 基因表達水平無差異(P>0.05)。
2.2 臨床研究結果
2.2.1 醫院收集正常和哮喘兒童血清學檢測結果
3 組間的 IL-4、IL-17 的蛋白含量和 GNA15 的 mRNA 含量比較,差異均有統計學意義(P<0.05)。組間兩兩比較結果顯示:與對照組比較,MA 組和 SA 組的 IL-4 和 IL-17 的蛋白含量均上調(P<0.05);IL-4 和 IL-17 的蛋白含量在 MA 組與 SA 組之間比較,差異無統計學意義(P>0.05);對照組與 MA 組的 GNA15 的 mRNA 含量比較,差異無統計學意義(P>0.05);SA 組的 GNA15 的 mRNA 含量高于 MA 組和對照組(P<0.05)。見表1。


2.2.2 兒童外周血 GNA15、IL-4、IL-17 預測 SA
ROC 曲線分析顯示,GNA15、IL-4 和 IL-17 預測兒童 SA 的曲線下面積(area under curve, AUC)分別為 0.861、0.760 和 0.818,靈敏度分別為 0.800、0.933 和 0.900,特異度分別為 0.929、0.607 和 0.607(P<0.05),見表2、圖8。


3 討論
哮喘目前被廣泛認為是一種異質性疾病,其中 SA 患兒由于癥狀的持續和惡化,且對藥物治療不敏感,預后較差,因此亟待挖掘 SA 的關鍵診療靶點。為了篩選 SA 患兒特異性診斷標志物,本研究分析了外周血單個核細胞的轉錄組測序數據,并通過基因表達分層分析和 WGCNA[12]分析兩組生物信息學算法,獲得 SA 患兒表達顯著上調且與 SA 患兒相關性最高的關鍵基因 GNA15。綜合生物信息學分析結果提示,GNA15 基因表達上調可能對難治性哮喘具有重要的臨床參考價值。
本課題組近期研究發現,GNA15 基因具有較好的預測 SA 哮喘預后的潛能[14]。然而,GNA15 的診斷價值以及相關機制仍不清楚。本研究驗證了 GNA15 基因在另一組 SA 患兒外周血以及 SA 患兒急性加重期和恢復期中的表達情況,發現 GNA15 基因在 SA 患兒外周血中顯著上調,且在急性加重期患兒的外周血中顯著上調。GNA15 基因編碼的 Gα15 蛋白屬于 Gα 蛋白 q 亞家族成員之一,其最早被報道為造血組織和肺組織特異性基因[15]。研究顯示,GNA15 與免疫系統關系密切,可維持補體 C5a 功能,調控巨噬細胞活化[16-17]。哮喘相關氣道炎癥多由嗜酸性粒細胞、肥大細胞、T 淋巴細胞、中性粒細胞等多種免疫細胞組分參與。研究顯示,兒童外周血中免疫細胞構成比、極化狀態也表型的差異可影響哮喘患兒對糖皮質激素的敏感性,這可能是兒童發展為 SA 的重要原因[18]。
轉錄組學和臨床研究表明,SA 的發病機制主要涉及 CD4+的輔助型 T 淋巴細胞(Th2)驅動的免疫通路活化,并釋放 IL-4 等炎癥因子,引起氣道重塑[19]。另一類 SA 哮喘表現為中性粒細胞介導的 IL-17 釋放,通過上調 CXC 趨化因子配體(CXC-chemokine ligand,CXCL)1、CXCL 8 和 IL-6 等因子,誘導氣道高反應[20]。因此,臨床上常將血清學 IL-4 和 IL-17 的含量作為哮喘的常規檢測指標。本研究將 GNA15 的表達特點與哮喘常規炎性標志物 IL-4、IL-17 對比,發現 GNA15 僅在 SA 哮喘患兒外周血單個核細胞中特異性高表達,這表明 GNA15 能較好區分 MA 和 SA,即可以較好地判斷哮喘兒童病情的嚴重程度。另外,本研究還分析比較了 GNA15、IL-4 和 IL-17 作為預測兒童 SA 的診斷價值,發現 GNA15 評價 SA 的特異性和準確度均優于 IL-4 和 IL-17。然而,GNA15 基因在哮喘疾病中參與調控何種炎癥細胞,目前未見文獻報道。為此,本研究進一步驗證了 GNA15 基因在哮喘相關炎癥細胞中的表達情況,發現 GNA15 基因在巨噬細胞、CD4+ T 細胞和 CD8+ T 細胞中表達與對照組無差異,而僅在嗜酸性粒細胞中表達顯著上調。一項隊列研究發現,外周嗜酸性粒細胞對兒童和成年哮喘急性加重具有重要的意義[21],為此,大多數研究將兒童 SA 的治療靶點聚焦于嗜酸性粒細胞[22-23],并發現貝那利珠單抗(Benralizumab)[24]、度普利尤單抗(Dupilumab)[25-26]等嗜酸性粒細胞靶向抑制藥對 SA 患兒具有很好的治療效果和安全性。并且,外周血嗜酸性粒細胞計數與痰液或者肺組織嗜酸性粒細胞計數相比,具有更好的監測哮喘患者對藥物治療的敏感性[23]。本研究發現 GNA15 特異性地高表達于嗜酸性粒細胞,以 GNA15 基因為切入點,進一步補充了嗜酸性粒細胞對 SA 患兒急性加重的潛在診斷價值。然而,本研究的結果仍需要更多的基礎研究,深入探索 GNA15 調節嗜酸性粒細胞影響哮喘的機制。
綜上所述,外周血 GNA15 在診斷兒童哮喘嚴重程度方面具有一定的臨床價值。
利益沖突:所有作者聲明不存在利益沖突。