引用本文: 相煒宏, 王立鋒, 苗運博, 傅恩清, 金發光. 博萊霉素誘導小鼠肺纖維化模型的差異基因表達譜分析. 中國呼吸與危重監護雜志, 2015, 14(3): 242-249. doi: 10.7507/1671-6205.2015061 復制
肺纖維化是缺乏特效治療手段的彌漫性肺間質疾病,其病理特征是肺泡上皮的損傷和成纖維細胞增殖、胞外基質過度沉積,引起進展性肺功能下降[1-3],最終誘發呼吸衰竭。隨著社會經濟的發展及環境污染,導致肺損傷因素的逐漸增多,肺纖維化的發病呈現逐年增加的趨勢,而許多慢性肺疾病,包括哮喘、慢性支氣管炎、支氣管擴張、慢性阻塞性肺疾病、肺結核、肺癌、間質性肺病等,在發生和發展的過程中都不同程度伴有肺組織纖維化的病理改變,發病率逐步增高。我國文獻報道肺纖維化患者住院死亡率為50.0%,首次診斷后1年和5年生存率分別為56.2%和18.4%[4]。本病發病機制不清,因此對肺纖維化發病機制的深入研究顯得十分迫切而有現實意義[5-6]。其中,博萊霉素誘導肺纖維化模型應用最多,該模型有良好的臨床相關性,病理過程也最為清晰,是研究肺纖維化發病機制和干預手段的重要工具[7]。
基因芯片(又稱DNA芯片、生物芯片)可以全面檢測和分析不同組織基因的差異表達,是一種高效大規模獲取生物信息的技術。近年來,基因芯片被廣泛應用于對生理變化、疾病過程以及細胞生物學行為變化過程分子規律的認識。本研究利用基因芯片數據分析軟件BRB-Array Tools軟件對來自于公共基因芯片數據庫(Gene Expression Omnibus,GEO)的13只小鼠肺纖維化組織基因表達譜芯片數據進行差異表達基因篩選[8-9],并利用DAVID(the Database for Annotation,Visualization and Intergration Discovery)工具對這些差異基因進行GO本體分析和KEGG通路分析,以從整體上了解肺纖維化整個基因組及信號通路的變化,從而進一步了解肺纖維化發病的分子機制,為臨床防治、診斷及治療等方面提供新的思路和方法。
材料與方法
一 材料
正常小鼠肺組織和博萊霉素誘導小鼠肺纖維化組織基因表達譜芯片數據來源于NCBI的GEO數據庫(http:/www.nebi.nlm.gov/geo/),登錄號為GES18800,由Sakata Daiji提供。實驗樣本13例,博萊霉素生理鹽水溶液(1 mg/kg,40 μL)或生理鹽水通過氣管內灌注誘導小鼠肺纖維化。組織標本每組取4~5個位點。經RNA提取、逆轉錄、擴增和熒光標記等步驟,最后Affymetrix Mouse Genome U430A芯片雜交,經Affym etrix GeneChip Seanner 3000掃描得到原始圖像數據,經標準化等處理后以CEL格式上傳至GEO數據庫。本研究分析了13個組織樣本,其中登錄號GSM466379、GSM466380、GSM466382和 GSM466385為正常小鼠肺組織,登錄號GSM466386、GSM466388、GSM466391和GSM466392為博萊霉素誘導第7 d時的小鼠肺纖維化組織,登錄號GSM466393、GSM466395、GSM466396、 GSM466397和GSM466398為博萊霉素誘導第14 d時的小鼠肺纖維化組織[
二 方法
1.數據過濾和標準化:從GEO數據庫中下載上述13個GSM,解壓縮后放入同一文件夾。利BRB-Array Tools Version 3.8.0 Beta2(http://linus.nei.nih.gov/BRB-ArrayTools.html)軟件包對數據進行統計學分析,為獲得質量高、表達信號強的基因,我們用中位值的方法對數據進行標準化。在對基因過濾時要求:(1)樣本的基因中位數值至少發生2.0倍的改變,且這種改變不少于20%的樣本數;(2)基因表達數據缺失數不超過50%。
2.小鼠肺纖維化組織表達譜差異基因的篩選:將上述以GSM編號的樣本按實驗設計分組,其中正常小鼠肺組織樣本4例,博萊霉素誘導小鼠肺纖維化7 d后的肺組織樣本第7 d 4例,第14 d 5例。對通過過濾標準的基因進行非配對樣本t檢驗,利用Class comparison工具對兩組樣本分類對比,找到小鼠肺纖維化組織的差異表達基因(P<0.05)。
3.博萊霉素誘導小鼠肺纖維化前后基因差異表達譜的生物信息學分析:利用DAVID在線工具對差異表達基因進行GO本體分析和KEGG通路分析。GO本體Cluster分為生物學過程(biological process,BP)、細胞組分(cellular component,CC)、分子功能 (molecular function,MF)。本研究主要通過集中分析生物學過程來認識肺纖維化病程背后的分子事件。
結果
一 數據過濾和標準化
根據預先設定的數據過濾標準和中位值標準化處理后,Affymetrix Mouse Genome U430A芯片雜交片上的45 101個探針中有12 218個通過了過濾標準,可用于進一步的生物信息學分析。
二 博萊霉素誘導小鼠肺纖維化組織表達譜差異基因的篩選
應用BRB-Array Tools軟件對兩組樣本分類比較了上千種表達差異顯著的基因(P<0.05,變化倍數>2),其中,小鼠肺纖維化第7 d上調1 164個,下調735個;第14 d上調731個,下調390個。上調和下調各表達差異前20個基因見表 1和2(按照變化倍數進行排列,>1為上調表達,<1為下調表達)。


三 博萊霉素誘導7 d后顯著差異表達基因群的GO本體分析和KEGG通路分析結果
對博萊霉素誘導小鼠纖維化7 d后顯著差異表達基因群的富集度(Cluster Enrichment score)分析發現,上調的基因顯著參與了細胞周期、損傷反應、趨化因子、應激反應、膠原代謝過程、細胞外基質及細胞遷移等多個生物學過程;而下調基因顯著參與了突觸傳導調控、離子轉運、細胞骨架結構等(圖 1)。KEGG通路分析發現,上調的基因參與細胞周期、細胞因子與細胞因子受體互作、P53信號通路、細胞外基質配體受體互作、趨化因子信號通路、黏著斑等,參與藥物代謝、PPAR信號通路、心肌收縮等多個信號通路的生物學過程(圖 2)。


四 博萊霉素誘導14 d后顯著差異表達基因群的GO本體分析和KEGG通路分析結果
博萊霉素誘導小鼠肺纖維化14 d后的顯著差異表達基因數量少于7 d,與在實驗模型中所觀察到的實驗小鼠反應有一定對應關系:第7 d的反應顯著重于第14 d。數據分析結果顯示顯著上調731個基因,下調390個基因。DAVID在線分析結果顯示,上調的基因顯著參與細胞周期、損傷反應、細胞骨架構、白細胞介導免疫、粘附細胞的調節、膠原代謝過程等多個生物過程;下調的基因顯著參與酶聯的蛋白受體信號途徑等(圖 3)。KEGG通路分析發現,上調基因顯著參與細胞周期、溶酶體、P53信號通路、黏著斑、細胞因子與細胞因子受體互作、趨化因子信號通路的等多個生物過程;下調基因參與藥物代謝、心肌收縮、激活受體信號通路、細胞色素P450代謝的外源性物質等多個生物學過程(圖 4)。對7 d和14 d的數據進行比較,結果顯示細胞外基質受體相互作用以及局部粘附相關信號通路分子在逐漸升高,但細胞因子及其受體相互作用以及化學因子信號通路分子顯著下調(圖 5)。



討論
肺纖維化是呼吸系統最常見的難治性疾病之一,它的發生和發展是一個復雜的過程,具有復雜的生物學行為,是許多纖維化相關基因和信號傳導分子的表達失常所致。肺纖維化患者往往預后較差,因此早期診斷和治療尤為重要。除傳統的治療外,近年來隨著社會進步和醫學發展,肺纖維化的免疫治療和基因治療的研究也正在飛速發展。然而,由于發病機制尚不明確,這些治療大多數針對少數普遍活化的通路或分子靶標進行,臨床療效也并不顯著。因此,深入了解病程變化過程的分子事件[11-12],將成為人們發現肺纖維化有效干預靶點的必經之路。
基因芯片具有特異性好、高通量、快速的特點,可直接檢測mRNA的種類及豐度,進行整個基因組范圍的基因表達分析,除具有高效、快速、平行化地檢測大規模基因表達的優勢外,還可以發現許多新的、潛在的重要纖維化相關基因,是研究基因表達的有力工具。BRB-Array Tools等芯片數據分析軟件是廣泛使用的基因芯片表達譜數據分析軟件,分別由Dr.Riehard Simon領導的生物識別小組和Geospiza公司開發,可用來比較發現兩個組間的基因表達差異(上調或下調),以此來闡述不同處理對樣本產生的影響。絕大部分基因芯片數據分析軟件都采用這種分析思路和方法,但這種方法僅能篩選在基因組中發生了顯著改變的差異基因。至于這些差異基因在疾病中如何相互作用,參與了哪些重要的生物學過程等方面卻無從知曉。而另一些生物信息學在線工具卻可以用于分析一組基因的功能,包括基因本體Cluster分析、KEGG通路分析、蛋白位點、miRNA預測等功能分析。本研究就是運用BRB-Array Tools和DAVID工具,對野生型小鼠正常肺組織和博萊霉素誘導小鼠肺纖維化組織的基因芯片表達譜數據集進行了生物學挖掘以及生物信息學分析,以利于更進一步的肺纖維化分子生物學研究。
我們從GEO數據庫中下載13個來源于小鼠樣本表達譜數據。差異表達分析顯示,小鼠肺纖維化后7 d上調的基因有1 164個,下調735個;第14 d上調731個,下調390個。為了解這些基因在肺纖維化病程的作用,進一步利用DAVID工具進行了相應的GO本體Cluster分析和KEGG通路分析。結果顯示,在小鼠肺纖維化早期(7 d),肺組織表達上調的基因顯著參與了細胞周期、損傷反應、趨化因子、應激反應、膠原代謝過程、細胞外基質及細胞遷移等多個生物學過程,其中119個細胞周期相關基因的上調預示著肺組織在該階段增殖活躍。在動物肺纖維化模型第7 d,公認的是肺組織以炎癥反應為主。在本次生物學過程分析中排在前列的創傷反應和化學趨化,信號通路分析中的細胞因子-受體相互作用,化學因子作用通路等,其實都是炎癥反應中的具體分子事件。不過,本研究發現的上調基因并非只是炎癥因子,其中上調最為顯著的細胞周期相關分子和通路提示伴隨炎癥進展的還有細胞的活躍增殖,包括局部組織受損后的炎性增殖,以及成纖維細胞的活化增殖。這也提示針對細胞周期的阻斷性藥物有可能阻斷炎癥反應的進展。值得注意的是其中的組織類型并不單一,可能同時含上皮細胞、成纖維細胞、肺泡細胞、炎癥細胞等。成纖維細胞的增殖一直被認為與纖維化的進程密切相關[13],但由于我們所分析的組織類型并不能排除局部浸潤的淋巴細胞等其他成分,所以還需要進一步分析其他單一組分的表達譜芯片結果才有助于進一步明確成纖維細胞活躍增殖的假說[14]。
分析結果所顯示的損傷反應、趨化因子、應激反應等生物學過程的上調能夠對應纖維化早期的組織反應,其中,膠原代謝過程和細胞外基質相關的分子群的上調(IBSP、LAMB3、LAMA3、COL11A1、THBS2、THBS3)提示與纖維化的發生直接相關[15]。下調的差異表達基因顯著參與細胞骨架構建、離子轉運和突觸傳導調控。KEGG通路分析也提示,上調的基因顯著參與細胞周期、細胞因子與細胞因子受體相互作用、P53信號通路、細胞外基質配體受體相互作用、趨化因子信號通路、黏著斑等。有意思的是,其中的P53信號通路本應發揮細胞周期阻滯的功能,顯然與之前在生物學過程和通路分析時顯示的細胞周期相關基因和信號通路的上調相矛盾。如前述分析所示,芯片檢測組織類型的非均一性將有可能作出解釋,目前我們尚不能確定組織樣本中哪些組織細胞周期活躍,而哪些組織的細胞周期受到顯著抑制。基于此結果的后續研究將為人們更清楚地認識這一過程奠定基礎。
對纖維化中期的差異表達分析發現,上調基因主要參與細胞周期、損傷反應、細胞骨架架構、白細胞介導免疫、粘附細胞的調節、膠原代謝過程等多個生物過程,下調基因參與酶聯受體蛋白等。在發現的下調基因中也并不都是與膠原形成有關。在下調基因的生物學過程分析中,我們發現最為顯著的是細胞骨架組織的相關分子,提示在組織纖維化的同時,伴隨了肺泡細胞原有結構和功能的損壞。而KEGG通路分析發現,上調基因參與細胞周期、溶酶體、P53信號通路、黏著斑、細胞因子與細胞因子受體互作、趨化因子信號通路,下調基因參與藥物代謝、心肌收縮、激活受體信號通路、細胞色素P450代謝。并在14 d時的差異基因中發現了TGFB2[16],細胞外基質配體受體互作差異基因7 d比14 d少COL4A1、IBSP、LAMB3、SDC1、SDC3基因。基因芯片從多方面檢測分析,說明肺纖維化有多種因子參與,TGF-β1不是唯一參與的細胞因子,因本研究分析未發現TGF-β1與C57小鼠肺纖維化有關,這是與其他研究的差別。同時,小鼠的個體差異、標本組織采取時間點的差別有可能是分子水平實驗結果存在差異的原因。
對小鼠博萊霉素氣管內灌注誘導肺纖維化病程的組織病理學研究發現,灌注后7 d時,小鼠肺組織出現明顯的炎性細胞浸潤,在第14 d時炎癥有所減輕而膠原開始積累,從第21 d開始纖維化逐漸明顯[17]。我們在基因芯片的分析中得到了相一致的結果,盡管在7 d和14 d的樣本中細胞周期、炎性趨化因子、膠原代謝過程、細胞外基質等多個細胞信號途徑或生物學過程相對于0 d都顯著上調,但在比較7 d和14 d的數據時,我們發現細胞外基質受體相互作用以及局部粘附相關信號通路分子確實在逐漸升高,但細胞因子及其受體相互作用以及化學因子這兩個信號通路(包括CCL1、CXCL1、IL1R2、IL-6、CCL2、CXCL5、CCR1、CXCL9、TNFSF14、CXCR2、CCL7、CCL17、CXCL10、CCL11、IFNA1、IL23A、CXCL13、CX3CR1在內)的一系列基因都顯著下調。這提示肺纖維化病程中的炎癥反應具有自限性,而促進細胞黏附和膠原分泌的信號卻逐漸增強。其中磷脂酰肌醇相關的激酶信號通路分子PIP5K1C和PIK3CD都有顯著上調,提示靶向該途徑將潛在通過干預細胞外基質相互作用的下游信號通路來有效抑制肺纖維化的進程。
綜上所述,肺纖維化的發生、發展是多基因異常引起多條信號通路異常,從而導致細胞惡性轉化的結果。通過對肺纖維化基因表達變化的基因芯片數據的挖掘及生物信息學分析,高效、系統、大規模地獲取生物內在信息,可以更好地理解肺纖維化進展、惡化的分子機制,為臨床肺纖維化防治、診斷及治療等方面提供新的思路和方法。
肺纖維化是缺乏特效治療手段的彌漫性肺間質疾病,其病理特征是肺泡上皮的損傷和成纖維細胞增殖、胞外基質過度沉積,引起進展性肺功能下降[1-3],最終誘發呼吸衰竭。隨著社會經濟的發展及環境污染,導致肺損傷因素的逐漸增多,肺纖維化的發病呈現逐年增加的趨勢,而許多慢性肺疾病,包括哮喘、慢性支氣管炎、支氣管擴張、慢性阻塞性肺疾病、肺結核、肺癌、間質性肺病等,在發生和發展的過程中都不同程度伴有肺組織纖維化的病理改變,發病率逐步增高。我國文獻報道肺纖維化患者住院死亡率為50.0%,首次診斷后1年和5年生存率分別為56.2%和18.4%[4]。本病發病機制不清,因此對肺纖維化發病機制的深入研究顯得十分迫切而有現實意義[5-6]。其中,博萊霉素誘導肺纖維化模型應用最多,該模型有良好的臨床相關性,病理過程也最為清晰,是研究肺纖維化發病機制和干預手段的重要工具[7]。
基因芯片(又稱DNA芯片、生物芯片)可以全面檢測和分析不同組織基因的差異表達,是一種高效大規模獲取生物信息的技術。近年來,基因芯片被廣泛應用于對生理變化、疾病過程以及細胞生物學行為變化過程分子規律的認識。本研究利用基因芯片數據分析軟件BRB-Array Tools軟件對來自于公共基因芯片數據庫(Gene Expression Omnibus,GEO)的13只小鼠肺纖維化組織基因表達譜芯片數據進行差異表達基因篩選[8-9],并利用DAVID(the Database for Annotation,Visualization and Intergration Discovery)工具對這些差異基因進行GO本體分析和KEGG通路分析,以從整體上了解肺纖維化整個基因組及信號通路的變化,從而進一步了解肺纖維化發病的分子機制,為臨床防治、診斷及治療等方面提供新的思路和方法。
材料與方法
一 材料
正常小鼠肺組織和博萊霉素誘導小鼠肺纖維化組織基因表達譜芯片數據來源于NCBI的GEO數據庫(http:/www.nebi.nlm.gov/geo/),登錄號為GES18800,由Sakata Daiji提供。實驗樣本13例,博萊霉素生理鹽水溶液(1 mg/kg,40 μL)或生理鹽水通過氣管內灌注誘導小鼠肺纖維化。組織標本每組取4~5個位點。經RNA提取、逆轉錄、擴增和熒光標記等步驟,最后Affymetrix Mouse Genome U430A芯片雜交,經Affym etrix GeneChip Seanner 3000掃描得到原始圖像數據,經標準化等處理后以CEL格式上傳至GEO數據庫。本研究分析了13個組織樣本,其中登錄號GSM466379、GSM466380、GSM466382和 GSM466385為正常小鼠肺組織,登錄號GSM466386、GSM466388、GSM466391和GSM466392為博萊霉素誘導第7 d時的小鼠肺纖維化組織,登錄號GSM466393、GSM466395、GSM466396、 GSM466397和GSM466398為博萊霉素誘導第14 d時的小鼠肺纖維化組織[
二 方法
1.數據過濾和標準化:從GEO數據庫中下載上述13個GSM,解壓縮后放入同一文件夾。利BRB-Array Tools Version 3.8.0 Beta2(http://linus.nei.nih.gov/BRB-ArrayTools.html)軟件包對數據進行統計學分析,為獲得質量高、表達信號強的基因,我們用中位值的方法對數據進行標準化。在對基因過濾時要求:(1)樣本的基因中位數值至少發生2.0倍的改變,且這種改變不少于20%的樣本數;(2)基因表達數據缺失數不超過50%。
2.小鼠肺纖維化組織表達譜差異基因的篩選:將上述以GSM編號的樣本按實驗設計分組,其中正常小鼠肺組織樣本4例,博萊霉素誘導小鼠肺纖維化7 d后的肺組織樣本第7 d 4例,第14 d 5例。對通過過濾標準的基因進行非配對樣本t檢驗,利用Class comparison工具對兩組樣本分類對比,找到小鼠肺纖維化組織的差異表達基因(P<0.05)。
3.博萊霉素誘導小鼠肺纖維化前后基因差異表達譜的生物信息學分析:利用DAVID在線工具對差異表達基因進行GO本體分析和KEGG通路分析。GO本體Cluster分為生物學過程(biological process,BP)、細胞組分(cellular component,CC)、分子功能 (molecular function,MF)。本研究主要通過集中分析生物學過程來認識肺纖維化病程背后的分子事件。
結果
一 數據過濾和標準化
根據預先設定的數據過濾標準和中位值標準化處理后,Affymetrix Mouse Genome U430A芯片雜交片上的45 101個探針中有12 218個通過了過濾標準,可用于進一步的生物信息學分析。
二 博萊霉素誘導小鼠肺纖維化組織表達譜差異基因的篩選
應用BRB-Array Tools軟件對兩組樣本分類比較了上千種表達差異顯著的基因(P<0.05,變化倍數>2),其中,小鼠肺纖維化第7 d上調1 164個,下調735個;第14 d上調731個,下調390個。上調和下調各表達差異前20個基因見表 1和2(按照變化倍數進行排列,>1為上調表達,<1為下調表達)。


三 博萊霉素誘導7 d后顯著差異表達基因群的GO本體分析和KEGG通路分析結果
對博萊霉素誘導小鼠纖維化7 d后顯著差異表達基因群的富集度(Cluster Enrichment score)分析發現,上調的基因顯著參與了細胞周期、損傷反應、趨化因子、應激反應、膠原代謝過程、細胞外基質及細胞遷移等多個生物學過程;而下調基因顯著參與了突觸傳導調控、離子轉運、細胞骨架結構等(圖 1)。KEGG通路分析發現,上調的基因參與細胞周期、細胞因子與細胞因子受體互作、P53信號通路、細胞外基質配體受體互作、趨化因子信號通路、黏著斑等,參與藥物代謝、PPAR信號通路、心肌收縮等多個信號通路的生物學過程(圖 2)。


四 博萊霉素誘導14 d后顯著差異表達基因群的GO本體分析和KEGG通路分析結果
博萊霉素誘導小鼠肺纖維化14 d后的顯著差異表達基因數量少于7 d,與在實驗模型中所觀察到的實驗小鼠反應有一定對應關系:第7 d的反應顯著重于第14 d。數據分析結果顯示顯著上調731個基因,下調390個基因。DAVID在線分析結果顯示,上調的基因顯著參與細胞周期、損傷反應、細胞骨架構、白細胞介導免疫、粘附細胞的調節、膠原代謝過程等多個生物過程;下調的基因顯著參與酶聯的蛋白受體信號途徑等(圖 3)。KEGG通路分析發現,上調基因顯著參與細胞周期、溶酶體、P53信號通路、黏著斑、細胞因子與細胞因子受體互作、趨化因子信號通路的等多個生物過程;下調基因參與藥物代謝、心肌收縮、激活受體信號通路、細胞色素P450代謝的外源性物質等多個生物學過程(圖 4)。對7 d和14 d的數據進行比較,結果顯示細胞外基質受體相互作用以及局部粘附相關信號通路分子在逐漸升高,但細胞因子及其受體相互作用以及化學因子信號通路分子顯著下調(圖 5)。



討論
肺纖維化是呼吸系統最常見的難治性疾病之一,它的發生和發展是一個復雜的過程,具有復雜的生物學行為,是許多纖維化相關基因和信號傳導分子的表達失常所致。肺纖維化患者往往預后較差,因此早期診斷和治療尤為重要。除傳統的治療外,近年來隨著社會進步和醫學發展,肺纖維化的免疫治療和基因治療的研究也正在飛速發展。然而,由于發病機制尚不明確,這些治療大多數針對少數普遍活化的通路或分子靶標進行,臨床療效也并不顯著。因此,深入了解病程變化過程的分子事件[11-12],將成為人們發現肺纖維化有效干預靶點的必經之路。
基因芯片具有特異性好、高通量、快速的特點,可直接檢測mRNA的種類及豐度,進行整個基因組范圍的基因表達分析,除具有高效、快速、平行化地檢測大規模基因表達的優勢外,還可以發現許多新的、潛在的重要纖維化相關基因,是研究基因表達的有力工具。BRB-Array Tools等芯片數據分析軟件是廣泛使用的基因芯片表達譜數據分析軟件,分別由Dr.Riehard Simon領導的生物識別小組和Geospiza公司開發,可用來比較發現兩個組間的基因表達差異(上調或下調),以此來闡述不同處理對樣本產生的影響。絕大部分基因芯片數據分析軟件都采用這種分析思路和方法,但這種方法僅能篩選在基因組中發生了顯著改變的差異基因。至于這些差異基因在疾病中如何相互作用,參與了哪些重要的生物學過程等方面卻無從知曉。而另一些生物信息學在線工具卻可以用于分析一組基因的功能,包括基因本體Cluster分析、KEGG通路分析、蛋白位點、miRNA預測等功能分析。本研究就是運用BRB-Array Tools和DAVID工具,對野生型小鼠正常肺組織和博萊霉素誘導小鼠肺纖維化組織的基因芯片表達譜數據集進行了生物學挖掘以及生物信息學分析,以利于更進一步的肺纖維化分子生物學研究。
我們從GEO數據庫中下載13個來源于小鼠樣本表達譜數據。差異表達分析顯示,小鼠肺纖維化后7 d上調的基因有1 164個,下調735個;第14 d上調731個,下調390個。為了解這些基因在肺纖維化病程的作用,進一步利用DAVID工具進行了相應的GO本體Cluster分析和KEGG通路分析。結果顯示,在小鼠肺纖維化早期(7 d),肺組織表達上調的基因顯著參與了細胞周期、損傷反應、趨化因子、應激反應、膠原代謝過程、細胞外基質及細胞遷移等多個生物學過程,其中119個細胞周期相關基因的上調預示著肺組織在該階段增殖活躍。在動物肺纖維化模型第7 d,公認的是肺組織以炎癥反應為主。在本次生物學過程分析中排在前列的創傷反應和化學趨化,信號通路分析中的細胞因子-受體相互作用,化學因子作用通路等,其實都是炎癥反應中的具體分子事件。不過,本研究發現的上調基因并非只是炎癥因子,其中上調最為顯著的細胞周期相關分子和通路提示伴隨炎癥進展的還有細胞的活躍增殖,包括局部組織受損后的炎性增殖,以及成纖維細胞的活化增殖。這也提示針對細胞周期的阻斷性藥物有可能阻斷炎癥反應的進展。值得注意的是其中的組織類型并不單一,可能同時含上皮細胞、成纖維細胞、肺泡細胞、炎癥細胞等。成纖維細胞的增殖一直被認為與纖維化的進程密切相關[13],但由于我們所分析的組織類型并不能排除局部浸潤的淋巴細胞等其他成分,所以還需要進一步分析其他單一組分的表達譜芯片結果才有助于進一步明確成纖維細胞活躍增殖的假說[14]。
分析結果所顯示的損傷反應、趨化因子、應激反應等生物學過程的上調能夠對應纖維化早期的組織反應,其中,膠原代謝過程和細胞外基質相關的分子群的上調(IBSP、LAMB3、LAMA3、COL11A1、THBS2、THBS3)提示與纖維化的發生直接相關[15]。下調的差異表達基因顯著參與細胞骨架構建、離子轉運和突觸傳導調控。KEGG通路分析也提示,上調的基因顯著參與細胞周期、細胞因子與細胞因子受體相互作用、P53信號通路、細胞外基質配體受體相互作用、趨化因子信號通路、黏著斑等。有意思的是,其中的P53信號通路本應發揮細胞周期阻滯的功能,顯然與之前在生物學過程和通路分析時顯示的細胞周期相關基因和信號通路的上調相矛盾。如前述分析所示,芯片檢測組織類型的非均一性將有可能作出解釋,目前我們尚不能確定組織樣本中哪些組織細胞周期活躍,而哪些組織的細胞周期受到顯著抑制。基于此結果的后續研究將為人們更清楚地認識這一過程奠定基礎。
對纖維化中期的差異表達分析發現,上調基因主要參與細胞周期、損傷反應、細胞骨架架構、白細胞介導免疫、粘附細胞的調節、膠原代謝過程等多個生物過程,下調基因參與酶聯受體蛋白等。在發現的下調基因中也并不都是與膠原形成有關。在下調基因的生物學過程分析中,我們發現最為顯著的是細胞骨架組織的相關分子,提示在組織纖維化的同時,伴隨了肺泡細胞原有結構和功能的損壞。而KEGG通路分析發現,上調基因參與細胞周期、溶酶體、P53信號通路、黏著斑、細胞因子與細胞因子受體互作、趨化因子信號通路,下調基因參與藥物代謝、心肌收縮、激活受體信號通路、細胞色素P450代謝。并在14 d時的差異基因中發現了TGFB2[16],細胞外基質配體受體互作差異基因7 d比14 d少COL4A1、IBSP、LAMB3、SDC1、SDC3基因。基因芯片從多方面檢測分析,說明肺纖維化有多種因子參與,TGF-β1不是唯一參與的細胞因子,因本研究分析未發現TGF-β1與C57小鼠肺纖維化有關,這是與其他研究的差別。同時,小鼠的個體差異、標本組織采取時間點的差別有可能是分子水平實驗結果存在差異的原因。
對小鼠博萊霉素氣管內灌注誘導肺纖維化病程的組織病理學研究發現,灌注后7 d時,小鼠肺組織出現明顯的炎性細胞浸潤,在第14 d時炎癥有所減輕而膠原開始積累,從第21 d開始纖維化逐漸明顯[17]。我們在基因芯片的分析中得到了相一致的結果,盡管在7 d和14 d的樣本中細胞周期、炎性趨化因子、膠原代謝過程、細胞外基質等多個細胞信號途徑或生物學過程相對于0 d都顯著上調,但在比較7 d和14 d的數據時,我們發現細胞外基質受體相互作用以及局部粘附相關信號通路分子確實在逐漸升高,但細胞因子及其受體相互作用以及化學因子這兩個信號通路(包括CCL1、CXCL1、IL1R2、IL-6、CCL2、CXCL5、CCR1、CXCL9、TNFSF14、CXCR2、CCL7、CCL17、CXCL10、CCL11、IFNA1、IL23A、CXCL13、CX3CR1在內)的一系列基因都顯著下調。這提示肺纖維化病程中的炎癥反應具有自限性,而促進細胞黏附和膠原分泌的信號卻逐漸增強。其中磷脂酰肌醇相關的激酶信號通路分子PIP5K1C和PIK3CD都有顯著上調,提示靶向該途徑將潛在通過干預細胞外基質相互作用的下游信號通路來有效抑制肺纖維化的進程。
綜上所述,肺纖維化的發生、發展是多基因異常引起多條信號通路異常,從而導致細胞惡性轉化的結果。通過對肺纖維化基因表達變化的基因芯片數據的挖掘及生物信息學分析,高效、系統、大規模地獲取生物內在信息,可以更好地理解肺纖維化進展、惡化的分子機制,為臨床肺纖維化防治、診斷及治療等方面提供新的思路和方法。