引用本文: 張冬梅, 江錚, 張麗玲, 朱婷婷. 轉錄激活因子 3 可作為狼瘡腎炎鐵死亡的生物標志物:基于生物信息學分析的研究. 華西醫學, 2023, 38(7): 1006-1013. doi: 10.7507/1002-0179.202305094 復制
系統性紅斑狼瘡是一種由異常免疫反應引起的自身免疫綜合征,腎臟受累時稱為狼瘡腎炎(lupus nephritis, LN)[1]。LN 是系統性紅斑狼瘡最嚴重的并發癥,可顯著增加死亡率[2],因此亟需更多的研究以闡明 LN 的發生發展機制,以利于尋找新的干預靶點。鐵死亡是一種鐵依賴性的、非凋亡調節的新型細胞死亡方式,主要由谷胱甘肽過氧化物酶 4 的生物活性降低或脂質過氧化和活性氧自由基的積累引起。鐵死亡與多種病理生理過程密切相關,包括自身免疫反應、炎癥調節、腫瘤發生發展等[3-4]。目前許多證據表明,鐵死亡在系統性紅斑狼瘡的免疫功能障礙、炎癥和組織損傷中起到十分關鍵的作用[5-6]。在 LN 小鼠模型的腎臟內可觀察到明顯鐵沉積,已有多種可調節鐵穩態的蛋白質被確定為系統性紅斑狼瘡的生物標志物,包括乳鐵蛋白、細胞色素 b-245 β鏈、趨化因子配體 5 和醛酮還原酶家族 1 成員 C1 等[5, 7]。研究顯示,鐵調素可通過降低游離鐵的利用率,減少巨噬細胞和 T 細胞的腎臟浸潤,從而減輕易感系統性紅斑狼瘡小鼠模型的腎臟炎癥損傷[8],但其具體機制仍不十分清楚。2022 年 10 月 5 日-12 月 5 日,筆者從 GEO(Gene Expression Omnibus)數據庫中下載 LN 患者及正常對照組的腎臟測序數據,從 FerrDb 數據庫中下載鐵死亡相關基因(ferroptosis-related gene, FRG),之后應用一系列生物信息學分析方法,包括差異表達基因篩查、基因富集分析及蛋白-蛋白相互作用網絡構建、關鍵基因篩選、內源性競爭 RNA(competing endogenouse RNA,ceRNA)網絡構建以及分子對接等,擬探索出 LN 中的鐵死亡關鍵生物標志物。現報告如下。
1 材料與方法
1.1 LN 差異表達基因及 FRG 的鑒定
LN 的 RNA 表達數據庫來源于 GEO 數據庫,序列號為 GSE112943。選取該數據集中的腎臟組織作為研究對象,包含 7 個對照組和 14 個 LN,共 21 個樣本。利用 R 軟件(4.0.2 版本)的 limma 軟件包來鑒別 LN 與對照組之間的差異表達基因。公共數據庫 FerrDb 是用于管理和鑒定鐵死亡相關標志物和調控因子以及鐵死亡關聯疾病的數據庫。從該數據庫中獲得經驗證的 FRG 用于后續分析。將 FRG 與 LN 差異表達基因進行 Veen 分析,最終得到 LN-FRG。
1.2 LN 差異表達基因的富集分析
為了進一步分析 LN 差異表達基因的相關生物學功能,采用基因集富集分析檢測 LN 差異表達基因的相關信號通路,使用 OmicStudio 在線工具對相關信號通路進行篩選。以 P<0.05 和錯誤發現率<25%的通路富集基因作為顯著基因集。
1.3 LN-FRG 的富集分析
利用 David 6.8 在線生物信息數據庫對 LN-FRG 進行京都基因和基因組數據庫(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析、基因本體(gene ontology, GO)功能富集分析,以深入了解 LN-FRG 的潛在生物學功能。
1.4 LN-FRG 的蛋白質間網絡構建及核心 LN-FRG 的篩選
利用 String 在線工具識別 LN-FRG 編碼蛋白質間的相互作用關系,并利用 Cytoscape 軟件(3.7.1 版本)進行可視化。利用 Cytoscape 軟件的 cytoHubba 插件的 4 種不同計算方法,包括 MCC(maximal clique centrality)、Degree、EPC(edge percolated component)和 MNC(maximum neighborhood component),篩選出 LN-FRG 中排名前 10 的關鍵樞紐基因,并將 4 種不同計算方法篩選出的樞紐基因進行 Veen 分析,得到共有的核心樞紐基因。
1.5 關鍵核心 LN-FRG 的驗證及其 ceRNA 網絡的構建
通過外部數據集 GSE32591 分析其中 LN 和對照組的差異表達基因,與上述核心 LN-FRG 求交集,得到關鍵核心 LN-FRG。通過 miRWalk 3.0 數據平臺搜索與共有 LN-FRG 相關的微 RNA。同時用以下標準在 DIANA-LncBase v.2 數據庫中預測與上述微 RNA 相互作用的長鏈非編碼 RNA:① 閾值=0.9;② 組織僅限于腎臟;③ 評分=1。基于上述微 RNA-mRNA 和長鏈非編碼 RNA-微 RNA 的相互作用建立 ceRNA 調控網絡。
1.6 關鍵核心 LN-FRG 編碼蛋白質的分子對接分析
從 PDB(Protein Data Bank)數據庫下載鐵死亡通路相關基因 SLC7A11(solute carrier family 7 member 11)[9]及 NRF2(nuclear factor erythroid 2-related factor 2)[10]編碼蛋白質的 3D 坐標,同時通過 Genecards 網站下載關鍵核心 LN-FRG 編碼蛋白質的 3D 模型。為了進一步證實關鍵核心 LN-FRG 與鐵死亡相關通路下游蛋白質的關系,分別將篩選出的關鍵核心 LN-FRG 編碼蛋白質與 SLC7A11 及 NRF2 編碼蛋白質上傳至 Zdock 在線分子對接網站,通過剛性對接的方式預測受體與配體的復合物模型,以 Zdock 所得最優模型分數為選擇標準,研究關鍵核心 LN-FRG 編碼蛋白質與 SLC7A11 及 NRF2 編碼蛋白質的相互作用方式。同時,鑒于嗎替麥考酚酯在 LN 的治療中至關重要,尤其具有炎癥及免疫調控作用,故研究其對關鍵核心 LN-FRG 的親和力,旨在進一步深入探討該藥物的作用位點,同時也可以為 LN 的治療提供新的靶點。從 PubChem 化合物數據庫中獲得嗎替麥考酚酯的分子結構,進行蛋白質-分子對接分析,探討兩者之間的結合能和相互作用模式。
2 研究結果
2.1 LN-FRG 的鑒定結果
通過 limma 軟件包差異表達分析共獲得 7672 個 LN 差異表達基因,其中上調差異表達基因 2614 個,下調差異表達基因 5058 個。從 FerrDb 數據庫獲得共 125 個經驗證的 FRG。取 LN 差異表達基因和 FRG 的交集后,共有 37 個 LN-FRG,包括 ACSF2、AGPAT3、ALB、ARRDC3、ASNS、ATF3、ATF4、CAPG、CBS、CHAC1、FTH1、GABPB1、GPT2、HNF4A、IREB2、MAPK14、NFE2L2、OXSR1、PCK2、PRDX1、RELA、RGS4、RIPK1、SLC1A4、SLC2A12、SLC2A6、SLC40A1、SRXN1、STEAP3、TSC22D3、TUBE1、TXNIP、TXNRD1、VEGFA、XBP1、YWHAE、ZNF419。
2.2 LN 差異表達基因的富集分析結果
LN 差異表達基因的功能富集分析結果顯示,LN 差異表達基因在 B 細胞受體信號通路、細胞周期、補體和凝血級聯途徑、脂肪酸代謝、甘油脂代謝、白細胞跨內皮遷移、Toll 樣受體通路、血管內皮生長因子信號通路、局灶黏附中顯著富集。
2.3 LN-FRG 的富集分析結果
上述 LN-FRG 的 KEGG 富集分析結果顯示,主要富集于以下信號通路:Nod 樣受體信號通路、脂質和動脈粥樣硬化、人巨細胞病毒感染、腫瘤壞死因子信號通路、神經營養因子信號通路、松弛素信號通路、鐵死亡、流體剪切應力與動脈粥樣硬化、非酒精性脂肪肝、磷脂酰肌醇 3 激酶-Akt 信號通路、RIG-I 樣信號通路、氨基酸的生物合成、活性氧、糖尿病并發癥相關晚期糖基化產物-晚期糖基化終末產物受體信號通路、Toll 樣受體信號通路(見表1)。上述 LN-FRG 的 GO 富集分析結果顯示,主要富集于以下生物學過程:細胞對血管內皮生長因子刺激的反應、RNA 聚合酶Ⅱ啟動子的轉錄正調控、細胞對葡萄糖饑餓的反應、內質網未折疊蛋白反應、細胞對腫瘤壞死因子的反應、內質網應激對 RNA 聚合酶Ⅱ啟動子轉錄的正向調節、凋亡的負向調控、細胞對氧化應激的反應、肝臟發育、血管內皮生長因子受體信號通路、活性氧代謝過程正向調控、鐵離子穩態、基因表達的正向調控、細胞氧化還原穩態(見表2)。


2.4 LN-FRG 的蛋白質間網絡的構建及核心 LN-FRG 的篩選結果
上述 37 個 LN-FRG 編碼的蛋白質間的相互作用關系見圖1,通過 cytoHubba 插件中 4 種不同計算方法篩選出的核心 LN-FRG 見圖2,共得到 6 個核心 LN-FRG(圖3),包括 ATF3、ALB、FTHI、XBP1、TXNRD1 和 NFE2L2。

紅圈表示上調,藍圈表示下調。顏色深度表示表達量,顏色越深則表達量越高

a. maximal clique centrality 計算方法;b. Degree 計算方法;c. edge percolated component 計算方法;d. maximum neighborhood component 計算方法。紅色越深代表該基因在蛋白質間網絡中排名越靠前,其在鐵死亡相關生物學過程中扮演的角色越重要

MCC:maximal clique centrality;EPC:edge percolated component;MNC:maximum neighborhood component
2.5 關鍵核心 LN-FRG 的驗證結果及其 ceRNA 網絡的構建
GSE32591 數據集中 LN 差異表達基因與上述 6 個核心 LN-FRG 求交集的結果顯示,ATF3(轉錄激活因子 3)在 2 個數據集中的表達均明顯升高(見表3),因此篩選出 ATF3 這一關鍵核心 LN-FRG。miRWalk 3.0 的搜索結果顯示,miR-27a-3p 和 miR-27b-3p 這 2 個微 RNA 與 ATF3 存在相互作用。DIANA-LncBase v.2 的預測結果顯示,與 miR-27a-3p、miR-27b-3p 相互作用的長鏈非編碼 RNA 有 10 個:AC010980.2、NEAT1、LINC02381、LINC01089、XIST、AC120036.4、AC044784.1、AC016717.2、AC135178.5、AC005261.1。基因 ATF3、miR-27a-3p 和 miR-27b-3p 與上述 10 個長鏈非編碼 RNA 構成了 ceRNA 調控網絡。

2.6 關鍵核心 LN-FRG 編碼蛋白質的分子對接
ATF3 編碼蛋白質與 SLC7A11 編碼蛋白質的 Zdock 最優模型得分為 1987.361,其可視化分析見圖4a。結果顯示,ATF3 編碼蛋白質可通過 SER181 殘基與 SLC7A11 編碼蛋白質的 THR182 殘基形成氫鍵相互作用,從而實現二者的穩定結合。ATF3 編碼蛋白質與 NRF2 編碼蛋白質的 Zdock 最優模型得分為 1421.783,其可視化分析見圖4b。結果顯示,ATF3 編碼蛋白質可通過 SER181 殘基與 NRF2 編碼蛋白質的 GLY325 殘基形成氫鍵相互作用,從而實現二者的穩定結合。ATF3 編碼蛋白質與嗎替麥考酚酯的蛋白質-分子對接分析結果顯示,嗎替麥考酚酯通過可見的氫鍵與 ATF3 編碼蛋白質靶標結合(圖4c)。對于 ATF3 編碼蛋白質,嗎替麥考酚酯具有?5.266 kcal/mol(1 kcal=4.2 kJ)的較低結合能,表明二者結合穩定。

a.
3 討論
本研究通過從 GEO 數據庫提取 LN 患者腎臟的高通量測序數據,利用公共數據庫 Ferrdb 及生物信息學技術鑒別出 2 個數據庫重疊的共 37 個 LN-FRG。并進一步對該 37 個 LN-FRG 進行 GO 和 KEGG 富集分析,結果顯示,LN-FRG 主要富集在炎癥、免疫調節及鐵死亡相關信號通路,如 Nod 樣受體信號通路[11]、腫瘤壞死因子信號通路[12]、鐵死亡、磷脂酰肌醇 3 激酶-Akt 信號通路[13]和 Toll 樣受體信號通路[14]等。GO 富集分析結果提示,LN-FRG 主要富集于凋亡負調控、細胞對氧化應激的反應、活性氧代謝過程的正調控、鐵離子穩態[15]、細胞氧化還原穩態等生物學過程。腎臟中的炎性小體激活、活性氧和單核細胞浸潤已被證明可引發 LN 的加速和惡化[16]。鐵死亡可通過調節多種免疫細胞及炎癥相關反應參與 LN 的進程。研究顯示,與健康對照組相比,狼瘡患者 CD4+ T 細胞中的細胞內鐵含量明顯增加[17]。同時,系統性紅斑狼瘡患者的單核細胞表現出明顯 M1 樣特征,即促炎特征[18]。M1 巨噬細胞表達出更高水平的誘導型一氧化氮合酶,從而導致其對鐵死亡具有較 M2 巨噬細胞更強的抵抗力,因此大量存活的 M1 巨噬細胞可分泌更多的促炎因子加速 LN 的發展[19]。近期的研究也顯示,在系統性紅斑狼瘡中,中性粒細胞死亡主要與鐵死亡有關[20]。本研究篩選出的 LN-FRG 主要富集在炎癥及免疫調節等通路,證明這些 FRG 可能通過參與炎癥及免疫調控介導 LN 的損傷。
本研究通過一系列生物信息學分析技術,共篩選出 6 個核心 LN-FRG,包括 ATF3、ALB、FTHI、XBP1、TXNRD1 和 NFE2L2,進一步通過外部數據集 GSE32591 的驗證篩選出 ATF3 這一關鍵核心 LN-FRG,其是環磷腺苷反應元件結合蛋白轉錄因子家族成員之一。ATF3 是一種適應性反應基因,參與細胞生物學過程以適應細胞外和/或細胞內的各種變化,其編碼的蛋白質為一種多功能蛋白,可能在不同病理生理環境下發揮不同作用。研究顯示,ATF3 可通過調控轉錄因子結合位點,如轉錄激活因子/環磷腺苷反應元件、轉錄激活蛋白-1、核因子κB 及 p53 來參與炎癥反應、細胞凋亡、細胞自噬等病理生理反應[21]。越來越多的研究顯示,ATF3 與多種疾病的鐵死亡過程關系密切,其主要通過 SLC7A11 和 NRF2 相關途徑發揮作用,ATF3 可能通過調節范可尼貧血互補群 D2,抑制缺血再灌注損傷中心肌細胞的鐵死亡[22]。ATF3 還可通過上調 NADPH 氧化酶,下調 SLC7A11 和過氧化氫酶,促進細胞內過氧化氫的積累,從而導致膠質瘤細胞發生鐵死亡[23]。索拉非尼是一種用于晚期肝細胞癌的分子靶向藥物,其具有心臟毒性,而 ATF3 可通過抑制 SLC7A11 表達,促進索拉非尼心臟毒性過程中鐵死亡的發生[24]。ATF3 還可通過介導 2 型糖尿病性骨質疏松的成骨細胞鐵死亡,調節成骨功能[25]。AU 富集元件 RNA 結合蛋白通過調控 NRF2 和 ATF3 拮抗鐵死亡,從而有利于膿毒癥誘導的急性肺損傷的治療[26]。
ATF3 同時也參與多種腎臟疾病的過程。研究表明,ATF3 是急性腎損傷的一種新的生物標志物,其在體外循環術后發生急性腎損傷患者的血液和尿液中早期表達增加[27]。同時在微小病變腎病、局灶節段性腎小球硬化[28]和糖尿病腎病[29]中,ATF3 的表達均明顯升高。芒柄花黃素是一種異黃酮類植物雌激素,通過抑制 Smad3/ATF3/SLC7A11 信號通路,改善腎小管上皮細胞和慢性腎病小鼠鐵死亡相關的纖維化[30]。本研究通過生物信息學分析發現,在 LN 患者腎臟中,ATF3 表達水平較正常組顯著升高,并且位于 LN-FRG 蛋白相互作用網絡的核心位置,其主要富集在炎癥及免疫相關調節通路,分子對接結果顯示 ATF3 編碼的蛋白質與 SLC7A11 及 NRF2 這 2 個 FRG 編碼的蛋白質穩定結合,提示其可能通過 SLC7A11 及 NRF2 相關信號通路參與鐵死亡的發生,進而通過鐵死亡參與了 LN 免疫及炎癥損傷。
本研究進一步預測了 ATF3 的 ceRNA 調控網絡,結果顯示多種長非編碼 RNA 可競爭性地與 hsa-miR-27a-5p 和 hsa-miR-27b-5p 結合,從而調節 ATF3 的表達。研究顯示,微 RNA-27a/轉化生長因子β活化激酶 1 結合蛋白 3/核因子κB 信號通路可參與膿毒癥小鼠的肝臟炎癥損傷[31]。微 RNA-27 還具有調節細胞增殖、凋亡和分化的作用[32]。研究顯示,上調微 RNA-27b 可促進腫瘤壞死因子-α刺激的成纖維細胞樣滑膜細胞凋亡[33]。本研究預測的 ATF3 的 ceRNA 調控網絡可能成為 LN 干預的新靶點。
綜上所述,本研究鑒定出 ATF3 這一關鍵核心 LN-FRG,并通過外部數據集對其進行驗證,進一步的生物信息學分析及分子對接結果均證實 ATF3 可能通過鐵死亡參與 LN 的炎癥及免疫損傷,為鐵死亡參與 LN 的發生提供了新的科學證據。
利益沖突:所有作者聲明不存在利益沖突。
系統性紅斑狼瘡是一種由異常免疫反應引起的自身免疫綜合征,腎臟受累時稱為狼瘡腎炎(lupus nephritis, LN)[1]。LN 是系統性紅斑狼瘡最嚴重的并發癥,可顯著增加死亡率[2],因此亟需更多的研究以闡明 LN 的發生發展機制,以利于尋找新的干預靶點。鐵死亡是一種鐵依賴性的、非凋亡調節的新型細胞死亡方式,主要由谷胱甘肽過氧化物酶 4 的生物活性降低或脂質過氧化和活性氧自由基的積累引起。鐵死亡與多種病理生理過程密切相關,包括自身免疫反應、炎癥調節、腫瘤發生發展等[3-4]。目前許多證據表明,鐵死亡在系統性紅斑狼瘡的免疫功能障礙、炎癥和組織損傷中起到十分關鍵的作用[5-6]。在 LN 小鼠模型的腎臟內可觀察到明顯鐵沉積,已有多種可調節鐵穩態的蛋白質被確定為系統性紅斑狼瘡的生物標志物,包括乳鐵蛋白、細胞色素 b-245 β鏈、趨化因子配體 5 和醛酮還原酶家族 1 成員 C1 等[5, 7]。研究顯示,鐵調素可通過降低游離鐵的利用率,減少巨噬細胞和 T 細胞的腎臟浸潤,從而減輕易感系統性紅斑狼瘡小鼠模型的腎臟炎癥損傷[8],但其具體機制仍不十分清楚。2022 年 10 月 5 日-12 月 5 日,筆者從 GEO(Gene Expression Omnibus)數據庫中下載 LN 患者及正常對照組的腎臟測序數據,從 FerrDb 數據庫中下載鐵死亡相關基因(ferroptosis-related gene, FRG),之后應用一系列生物信息學分析方法,包括差異表達基因篩查、基因富集分析及蛋白-蛋白相互作用網絡構建、關鍵基因篩選、內源性競爭 RNA(competing endogenouse RNA,ceRNA)網絡構建以及分子對接等,擬探索出 LN 中的鐵死亡關鍵生物標志物。現報告如下。
1 材料與方法
1.1 LN 差異表達基因及 FRG 的鑒定
LN 的 RNA 表達數據庫來源于 GEO 數據庫,序列號為 GSE112943。選取該數據集中的腎臟組織作為研究對象,包含 7 個對照組和 14 個 LN,共 21 個樣本。利用 R 軟件(4.0.2 版本)的 limma 軟件包來鑒別 LN 與對照組之間的差異表達基因。公共數據庫 FerrDb 是用于管理和鑒定鐵死亡相關標志物和調控因子以及鐵死亡關聯疾病的數據庫。從該數據庫中獲得經驗證的 FRG 用于后續分析。將 FRG 與 LN 差異表達基因進行 Veen 分析,最終得到 LN-FRG。
1.2 LN 差異表達基因的富集分析
為了進一步分析 LN 差異表達基因的相關生物學功能,采用基因集富集分析檢測 LN 差異表達基因的相關信號通路,使用 OmicStudio 在線工具對相關信號通路進行篩選。以 P<0.05 和錯誤發現率<25%的通路富集基因作為顯著基因集。
1.3 LN-FRG 的富集分析
利用 David 6.8 在線生物信息數據庫對 LN-FRG 進行京都基因和基因組數據庫(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析、基因本體(gene ontology, GO)功能富集分析,以深入了解 LN-FRG 的潛在生物學功能。
1.4 LN-FRG 的蛋白質間網絡構建及核心 LN-FRG 的篩選
利用 String 在線工具識別 LN-FRG 編碼蛋白質間的相互作用關系,并利用 Cytoscape 軟件(3.7.1 版本)進行可視化。利用 Cytoscape 軟件的 cytoHubba 插件的 4 種不同計算方法,包括 MCC(maximal clique centrality)、Degree、EPC(edge percolated component)和 MNC(maximum neighborhood component),篩選出 LN-FRG 中排名前 10 的關鍵樞紐基因,并將 4 種不同計算方法篩選出的樞紐基因進行 Veen 分析,得到共有的核心樞紐基因。
1.5 關鍵核心 LN-FRG 的驗證及其 ceRNA 網絡的構建
通過外部數據集 GSE32591 分析其中 LN 和對照組的差異表達基因,與上述核心 LN-FRG 求交集,得到關鍵核心 LN-FRG。通過 miRWalk 3.0 數據平臺搜索與共有 LN-FRG 相關的微 RNA。同時用以下標準在 DIANA-LncBase v.2 數據庫中預測與上述微 RNA 相互作用的長鏈非編碼 RNA:① 閾值=0.9;② 組織僅限于腎臟;③ 評分=1。基于上述微 RNA-mRNA 和長鏈非編碼 RNA-微 RNA 的相互作用建立 ceRNA 調控網絡。
1.6 關鍵核心 LN-FRG 編碼蛋白質的分子對接分析
從 PDB(Protein Data Bank)數據庫下載鐵死亡通路相關基因 SLC7A11(solute carrier family 7 member 11)[9]及 NRF2(nuclear factor erythroid 2-related factor 2)[10]編碼蛋白質的 3D 坐標,同時通過 Genecards 網站下載關鍵核心 LN-FRG 編碼蛋白質的 3D 模型。為了進一步證實關鍵核心 LN-FRG 與鐵死亡相關通路下游蛋白質的關系,分別將篩選出的關鍵核心 LN-FRG 編碼蛋白質與 SLC7A11 及 NRF2 編碼蛋白質上傳至 Zdock 在線分子對接網站,通過剛性對接的方式預測受體與配體的復合物模型,以 Zdock 所得最優模型分數為選擇標準,研究關鍵核心 LN-FRG 編碼蛋白質與 SLC7A11 及 NRF2 編碼蛋白質的相互作用方式。同時,鑒于嗎替麥考酚酯在 LN 的治療中至關重要,尤其具有炎癥及免疫調控作用,故研究其對關鍵核心 LN-FRG 的親和力,旨在進一步深入探討該藥物的作用位點,同時也可以為 LN 的治療提供新的靶點。從 PubChem 化合物數據庫中獲得嗎替麥考酚酯的分子結構,進行蛋白質-分子對接分析,探討兩者之間的結合能和相互作用模式。
2 研究結果
2.1 LN-FRG 的鑒定結果
通過 limma 軟件包差異表達分析共獲得 7672 個 LN 差異表達基因,其中上調差異表達基因 2614 個,下調差異表達基因 5058 個。從 FerrDb 數據庫獲得共 125 個經驗證的 FRG。取 LN 差異表達基因和 FRG 的交集后,共有 37 個 LN-FRG,包括 ACSF2、AGPAT3、ALB、ARRDC3、ASNS、ATF3、ATF4、CAPG、CBS、CHAC1、FTH1、GABPB1、GPT2、HNF4A、IREB2、MAPK14、NFE2L2、OXSR1、PCK2、PRDX1、RELA、RGS4、RIPK1、SLC1A4、SLC2A12、SLC2A6、SLC40A1、SRXN1、STEAP3、TSC22D3、TUBE1、TXNIP、TXNRD1、VEGFA、XBP1、YWHAE、ZNF419。
2.2 LN 差異表達基因的富集分析結果
LN 差異表達基因的功能富集分析結果顯示,LN 差異表達基因在 B 細胞受體信號通路、細胞周期、補體和凝血級聯途徑、脂肪酸代謝、甘油脂代謝、白細胞跨內皮遷移、Toll 樣受體通路、血管內皮生長因子信號通路、局灶黏附中顯著富集。
2.3 LN-FRG 的富集分析結果
上述 LN-FRG 的 KEGG 富集分析結果顯示,主要富集于以下信號通路:Nod 樣受體信號通路、脂質和動脈粥樣硬化、人巨細胞病毒感染、腫瘤壞死因子信號通路、神經營養因子信號通路、松弛素信號通路、鐵死亡、流體剪切應力與動脈粥樣硬化、非酒精性脂肪肝、磷脂酰肌醇 3 激酶-Akt 信號通路、RIG-I 樣信號通路、氨基酸的生物合成、活性氧、糖尿病并發癥相關晚期糖基化產物-晚期糖基化終末產物受體信號通路、Toll 樣受體信號通路(見表1)。上述 LN-FRG 的 GO 富集分析結果顯示,主要富集于以下生物學過程:細胞對血管內皮生長因子刺激的反應、RNA 聚合酶Ⅱ啟動子的轉錄正調控、細胞對葡萄糖饑餓的反應、內質網未折疊蛋白反應、細胞對腫瘤壞死因子的反應、內質網應激對 RNA 聚合酶Ⅱ啟動子轉錄的正向調節、凋亡的負向調控、細胞對氧化應激的反應、肝臟發育、血管內皮生長因子受體信號通路、活性氧代謝過程正向調控、鐵離子穩態、基因表達的正向調控、細胞氧化還原穩態(見表2)。


2.4 LN-FRG 的蛋白質間網絡的構建及核心 LN-FRG 的篩選結果
上述 37 個 LN-FRG 編碼的蛋白質間的相互作用關系見圖1,通過 cytoHubba 插件中 4 種不同計算方法篩選出的核心 LN-FRG 見圖2,共得到 6 個核心 LN-FRG(圖3),包括 ATF3、ALB、FTHI、XBP1、TXNRD1 和 NFE2L2。

紅圈表示上調,藍圈表示下調。顏色深度表示表達量,顏色越深則表達量越高

a. maximal clique centrality 計算方法;b. Degree 計算方法;c. edge percolated component 計算方法;d. maximum neighborhood component 計算方法。紅色越深代表該基因在蛋白質間網絡中排名越靠前,其在鐵死亡相關生物學過程中扮演的角色越重要

MCC:maximal clique centrality;EPC:edge percolated component;MNC:maximum neighborhood component
2.5 關鍵核心 LN-FRG 的驗證結果及其 ceRNA 網絡的構建
GSE32591 數據集中 LN 差異表達基因與上述 6 個核心 LN-FRG 求交集的結果顯示,ATF3(轉錄激活因子 3)在 2 個數據集中的表達均明顯升高(見表3),因此篩選出 ATF3 這一關鍵核心 LN-FRG。miRWalk 3.0 的搜索結果顯示,miR-27a-3p 和 miR-27b-3p 這 2 個微 RNA 與 ATF3 存在相互作用。DIANA-LncBase v.2 的預測結果顯示,與 miR-27a-3p、miR-27b-3p 相互作用的長鏈非編碼 RNA 有 10 個:AC010980.2、NEAT1、LINC02381、LINC01089、XIST、AC120036.4、AC044784.1、AC016717.2、AC135178.5、AC005261.1。基因 ATF3、miR-27a-3p 和 miR-27b-3p 與上述 10 個長鏈非編碼 RNA 構成了 ceRNA 調控網絡。

2.6 關鍵核心 LN-FRG 編碼蛋白質的分子對接
ATF3 編碼蛋白質與 SLC7A11 編碼蛋白質的 Zdock 最優模型得分為 1987.361,其可視化分析見圖4a。結果顯示,ATF3 編碼蛋白質可通過 SER181 殘基與 SLC7A11 編碼蛋白質的 THR182 殘基形成氫鍵相互作用,從而實現二者的穩定結合。ATF3 編碼蛋白質與 NRF2 編碼蛋白質的 Zdock 最優模型得分為 1421.783,其可視化分析見圖4b。結果顯示,ATF3 編碼蛋白質可通過 SER181 殘基與 NRF2 編碼蛋白質的 GLY325 殘基形成氫鍵相互作用,從而實現二者的穩定結合。ATF3 編碼蛋白質與嗎替麥考酚酯的蛋白質-分子對接分析結果顯示,嗎替麥考酚酯通過可見的氫鍵與 ATF3 編碼蛋白質靶標結合(圖4c)。對于 ATF3 編碼蛋白質,嗎替麥考酚酯具有?5.266 kcal/mol(1 kcal=4.2 kJ)的較低結合能,表明二者結合穩定。

a.
3 討論
本研究通過從 GEO 數據庫提取 LN 患者腎臟的高通量測序數據,利用公共數據庫 Ferrdb 及生物信息學技術鑒別出 2 個數據庫重疊的共 37 個 LN-FRG。并進一步對該 37 個 LN-FRG 進行 GO 和 KEGG 富集分析,結果顯示,LN-FRG 主要富集在炎癥、免疫調節及鐵死亡相關信號通路,如 Nod 樣受體信號通路[11]、腫瘤壞死因子信號通路[12]、鐵死亡、磷脂酰肌醇 3 激酶-Akt 信號通路[13]和 Toll 樣受體信號通路[14]等。GO 富集分析結果提示,LN-FRG 主要富集于凋亡負調控、細胞對氧化應激的反應、活性氧代謝過程的正調控、鐵離子穩態[15]、細胞氧化還原穩態等生物學過程。腎臟中的炎性小體激活、活性氧和單核細胞浸潤已被證明可引發 LN 的加速和惡化[16]。鐵死亡可通過調節多種免疫細胞及炎癥相關反應參與 LN 的進程。研究顯示,與健康對照組相比,狼瘡患者 CD4+ T 細胞中的細胞內鐵含量明顯增加[17]。同時,系統性紅斑狼瘡患者的單核細胞表現出明顯 M1 樣特征,即促炎特征[18]。M1 巨噬細胞表達出更高水平的誘導型一氧化氮合酶,從而導致其對鐵死亡具有較 M2 巨噬細胞更強的抵抗力,因此大量存活的 M1 巨噬細胞可分泌更多的促炎因子加速 LN 的發展[19]。近期的研究也顯示,在系統性紅斑狼瘡中,中性粒細胞死亡主要與鐵死亡有關[20]。本研究篩選出的 LN-FRG 主要富集在炎癥及免疫調節等通路,證明這些 FRG 可能通過參與炎癥及免疫調控介導 LN 的損傷。
本研究通過一系列生物信息學分析技術,共篩選出 6 個核心 LN-FRG,包括 ATF3、ALB、FTHI、XBP1、TXNRD1 和 NFE2L2,進一步通過外部數據集 GSE32591 的驗證篩選出 ATF3 這一關鍵核心 LN-FRG,其是環磷腺苷反應元件結合蛋白轉錄因子家族成員之一。ATF3 是一種適應性反應基因,參與細胞生物學過程以適應細胞外和/或細胞內的各種變化,其編碼的蛋白質為一種多功能蛋白,可能在不同病理生理環境下發揮不同作用。研究顯示,ATF3 可通過調控轉錄因子結合位點,如轉錄激活因子/環磷腺苷反應元件、轉錄激活蛋白-1、核因子κB 及 p53 來參與炎癥反應、細胞凋亡、細胞自噬等病理生理反應[21]。越來越多的研究顯示,ATF3 與多種疾病的鐵死亡過程關系密切,其主要通過 SLC7A11 和 NRF2 相關途徑發揮作用,ATF3 可能通過調節范可尼貧血互補群 D2,抑制缺血再灌注損傷中心肌細胞的鐵死亡[22]。ATF3 還可通過上調 NADPH 氧化酶,下調 SLC7A11 和過氧化氫酶,促進細胞內過氧化氫的積累,從而導致膠質瘤細胞發生鐵死亡[23]。索拉非尼是一種用于晚期肝細胞癌的分子靶向藥物,其具有心臟毒性,而 ATF3 可通過抑制 SLC7A11 表達,促進索拉非尼心臟毒性過程中鐵死亡的發生[24]。ATF3 還可通過介導 2 型糖尿病性骨質疏松的成骨細胞鐵死亡,調節成骨功能[25]。AU 富集元件 RNA 結合蛋白通過調控 NRF2 和 ATF3 拮抗鐵死亡,從而有利于膿毒癥誘導的急性肺損傷的治療[26]。
ATF3 同時也參與多種腎臟疾病的過程。研究表明,ATF3 是急性腎損傷的一種新的生物標志物,其在體外循環術后發生急性腎損傷患者的血液和尿液中早期表達增加[27]。同時在微小病變腎病、局灶節段性腎小球硬化[28]和糖尿病腎病[29]中,ATF3 的表達均明顯升高。芒柄花黃素是一種異黃酮類植物雌激素,通過抑制 Smad3/ATF3/SLC7A11 信號通路,改善腎小管上皮細胞和慢性腎病小鼠鐵死亡相關的纖維化[30]。本研究通過生物信息學分析發現,在 LN 患者腎臟中,ATF3 表達水平較正常組顯著升高,并且位于 LN-FRG 蛋白相互作用網絡的核心位置,其主要富集在炎癥及免疫相關調節通路,分子對接結果顯示 ATF3 編碼的蛋白質與 SLC7A11 及 NRF2 這 2 個 FRG 編碼的蛋白質穩定結合,提示其可能通過 SLC7A11 及 NRF2 相關信號通路參與鐵死亡的發生,進而通過鐵死亡參與了 LN 免疫及炎癥損傷。
本研究進一步預測了 ATF3 的 ceRNA 調控網絡,結果顯示多種長非編碼 RNA 可競爭性地與 hsa-miR-27a-5p 和 hsa-miR-27b-5p 結合,從而調節 ATF3 的表達。研究顯示,微 RNA-27a/轉化生長因子β活化激酶 1 結合蛋白 3/核因子κB 信號通路可參與膿毒癥小鼠的肝臟炎癥損傷[31]。微 RNA-27 還具有調節細胞增殖、凋亡和分化的作用[32]。研究顯示,上調微 RNA-27b 可促進腫瘤壞死因子-α刺激的成纖維細胞樣滑膜細胞凋亡[33]。本研究預測的 ATF3 的 ceRNA 調控網絡可能成為 LN 干預的新靶點。
綜上所述,本研究鑒定出 ATF3 這一關鍵核心 LN-FRG,并通過外部數據集對其進行驗證,進一步的生物信息學分析及分子對接結果均證實 ATF3 可能通過鐵死亡參與 LN 的炎癥及免疫損傷,為鐵死亡參與 LN 的發生提供了新的科學證據。
利益沖突:所有作者聲明不存在利益沖突。