引用本文: 劉儀凡, 席亞明. 骨髓增生異常綜合征中環狀 RNA 差異表達的生物信息學分析. 華西醫學, 2023, 38(7): 1053-1057. doi: 10.7507/1002-0179.202303031 復制
骨髓增生異常綜合征(myelodysplastic syndrome, MDS)是一組異質性顯著的髓系克隆性惡性疾病,其特征是無效造血、難治性外周血細胞進行性減少、進展為急性髓系白血病的風險增加和總生存率差[1]。MDS 在兒童期和青少年期發病并不常見,但隨著年齡的增長而發病率逐年上升[2]。環狀 RNA(circular RNA, circRNA)是借助高通量測序探索到的新型 RNA[3]。作為非編碼 RNA,不具有 5’帽和 3’自由末端,通過一種名為“反向剪接”的剪接機制從信使 RNA(messenger RNA, mRNA)的前體以閉環形式導出,已成 RNA 生物學的研究熱點[4-5]。在多種癌癥中,circRNA 調節重要的細胞過程,包括增殖、侵襲和轉移,circRNA 可以作為競爭性內源 RNA(competing endogenous RNA, ceRNA)發揮作用,ceRNA 充當編碼 RNA 和非編碼 RNA 之間的溝通橋梁,與微 RNA(microRNA, miRNA)競爭,從而形成跨轉錄組的調控網絡即 circRNA-miRNA-mRNA 軸[6-7]。近年來,circRNA 及其 ceRNA 網絡在 MDS 發生發展中的作用引起了人們的關注,本研究旨在通過生物信息學分析,篩選出差異表達的 circRNA 及 mRNA,構建 ceRNA 網絡,探索 circRNA 在 MDS 中的重要作用。
1 材料與方法
1.1 數據集的獲取和預處理
在 GEO(Gene Expression Omnibus)中選取 GSE163386 數據集(5 例 MDS 患者,5 例急性髓系白血病患者和 4 例對照患者的骨髓樣本)和 GSE94591 數據集(4 例健康對照者和 6 例急性髓系白血病患者)[8],因 GSE163386 數據集中的對照組為脾功能亢進、血小板減少以及白細胞減少的患者,且上述 2 個數據集的平臺注釋文件一致,遂本研究將上述 2 個數據集合并,在 R 4.2.1 環境下,將 GSE163386 數據集中的 5 例 MDS 患者的表達譜芯片數據、GSE94591 數據集中的 4 例健康對照者表達譜芯片數據進行合并,并處理合并后的數據集,最后得到 circRNA 的完整表達矩陣。對 GSE81173 數據集(6 例健康對照者和 12 例 MDS 患者)進行處理,得到 mRNA 的完整表達矩陣。
1.2 基于 limma 包進行差異分析
在 R 4.2.1 環境下,選擇 limma 包差異分析差異表達 circRNA、mRNA 表達矩陣,以校正 P<0.05 和|log2 差異倍數|≥2 為選擇標準,篩選出較顯著差異表達的 circRNA 和 mRNA。進一步以差異倍數>10 為 circRNA 的篩選條件,最后根據 circBase 數據庫對得到的 circRNA 進行標準化命名轉化。于表達矩陣找到 MDS 組與健康對照組中 circRNA 對應的表達量并用 pheatmap 包繪制聚類熱圖。
1.3 ceRNA 網絡的構建
利用人類 circRNA 信息數據庫 circBank 預測與上述差異倍數>10 的差異表達 circRNA 相互作用的 miRNA,進一步利用 ENCORI、miRDB、miRWalk 數據庫預測與上述差異表達 mRNA 相互作用的 miRNA,取二者交集,利用 Cytoscape 3.9.1 繪制 circRNA-miRNA-mRNA 軸的網絡圖。以“myelodysplastic syndrome”為關鍵詞,于 PubMed 中檢索得到與 MDS 有關的 miRNA,取交集進一步得到 MDS 相關的 ceRNA 網絡。
2 結果
2.1 MDS 中差異表達 circRNA 的篩選結果
通過分析 circRNA 表達矩陣,得到差異表達 circRNA 共 5397 個,篩選后得到較顯著差異表達 circRNA 共 128 個,其中 MDS 患者組高表達的 circRNA 有 48 個,MDS 患者組低表達的 circRNA 有 80 個。以差異倍數>10 再次處理數據,結果顯示 3 個表達上調(表1),11 個表達下調(表2)。MDS 組與健康對照組 circRNA 表達量的聚類熱圖見圖1。通過分析 mRNA 表達矩陣,得到差異表達 mRNA 共 19254 個,篩選后得到較顯著差異表達 mRNA 共 101 個,MDS 組中 9 個表達上調,92 個表達下調。



T 代表骨髓增生異常綜合征組;N 代表健康對照組。列為樣本表達譜;行為標準命名的環狀 RNA。紅色為表達上調,藍色為表達下調,白色為中等表達
2.2 ceRNA 網絡的構建結果
通過 circBank 預測的與差異表達 circRNA 相互作用的 miRNA 有 582 個,進一步通過 ENCORI、miRDB、miRWalk 數據庫預測的與差異表達 mRNA 相互作用的 miRNA 有 348 個,取交集得到均上調的 miRNA 有 1 個,均下調的 miRNA 有 72 個,構建 circRNA-miRNA-mRNA 軸(圖2)。構建的 circRNA-miRNA-mRNA 軸由 11 個 circRNA、73 個 miRNA、37 個 mRNA 組成。與 PubMed 檢索得到的 MDS 相關 miRNA 取交集進一步得到 MDS 相關的 ceRNA 網絡,即 circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9、SLC16A6)和 circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5、SLC16A6、IRF4),這些網絡均為下調表達。

藍色三角箭頭表示環狀 RNA,紅色菱形表示微 RNA,紫色圓形表示信使 RNA,黑色箭頭與線表示環狀 RNA-微 RNA,灰色箭頭與線表示微 RNA-信使 RNA,右下角為上調表達的競爭性內源 RNA 調控網絡,其余均為下調表達
3 討論
circRNA 是一種具有生物活性的核酸分子,以閉環 RNA 的形式存在,與 mRNA 不同,circRNA 缺少聚腺苷酸化的尾部[9]。盡管一些 circRNA 具有蛋白質編碼潛力,但常常被歸類為非編碼 RNA[10]。近年來,越來越多的研究揭示了 circRNA 在不同生物學過程中的重要作用,特別是在肺癌[11]、膀胱癌[12]、胃癌[13]、肝癌[14]等不同癌癥的發病機制、疾病進展過程以及癌細胞遷移中有著重要作用,這提示 circRNA 作為分子診斷生物標志物具有潛在意義。
MDS 是一種克隆性疾病,circRNA 在 MDS 中發揮重要作用。本研究通過處理 GEO 數據庫得到 GSE163386 和 GSE94591 這 2 個 circRNA 數據集,并結合 GSE81173 這 1 個 mRNA 數據集,構建 circRNA-miRNA-mRNA 軸,由 11 個 circRNA、73 個 miRNA、37 個 mRNA 組成。既往文獻報道,miR-16-5p 和 miR-125b-5p 為 MDS 的生物標志物[15]。本研究進一步得到 MDS 相關的 ceRNA 網絡即 circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9、SLC16A6)和 circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5、SLC16A6、IRF4),這些網絡均為下調。
circRNA 在癌癥發展和某些類型的病理反應中發揮著重要作用,充當 miRNA 海綿來調節基因表達,形成 circRNA-miRNA-mRNA 軸,也稱為 ceRNA 網絡[16]。RUBCNL 是一種蛋白質編碼基因,也被稱為 PACER、C13orf18 以及 KIAA0226,與 RUBCNL 相關的疾病包括宮頸癌和子宮原位癌。在營養豐富的條件下,RUBCNL 被哺乳動物雷帕霉素靶蛋白復合體 1 介導的磷酸化滅活,當營養不足時,RUBCNL 被去磷酸化,這有利于其乙酰化,而乙酰化的 RUBCNL 顯著增強同型融合和蛋白分選復合體的募集,最終導致體外和體內更有效的自噬體成熟和脂質代謝[17]。TBC1D9 也通過自噬發揮作用,是一種新型的自噬調節器,TBC1D9 通過鈣離子依賴的泛素識別來控制 TANK 結合激酶 1 在異體自噬和有絲分裂過程中的激活[18],而 TANK 結合激酶 1 活性失調通常不僅與傳染性疾病有關,還與自身免疫性疾病和癌癥有關,并且既往研究表明造血干細胞區室中缺失 ATG7 的小鼠具有 MDS 樣表型[19],因此自噬和線粒體功能障礙與 MDS 的發病機制有關。綜上,circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9)可能是通過調節自噬,從而產生與 MDS 發生發展之間的聯系,而 SLC16A6 是一種蛋白質編碼基因,別名為 MCT6、MCT7。SLC16A6 可以預測皮膚黑色素瘤的特異性生存[20],但是尚未發現該基因與血液系統疾病之間的聯系。
IRF4 在 B 細胞的發育分化和淋巴細胞的增殖活化中起重要作用,敲除 IRF4 后,小鼠活化的淋巴細胞和漿細胞數量明顯減少,血清免疫球蛋白水平顯著下降,T 淋巴細胞的細胞毒作用或抗腫瘤作用減弱[21]。IRF4 在 MDS 中低表達,circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(IRF4)軸通過誘導體液免疫和細胞免疫抑制,從而減弱機體抗腫瘤作用。
CCR5 基因編碼的蛋白是一種 G 蛋白偶聯受體,見于不同種類的癌,主要作用于癌癥進展的晚期事件(如腫瘤轉移),CCR5/CCL5 軸具有促腫瘤效應,故 CCR5 低表達與更好的預后相關[22]。Zilio 等[23]的研究也表明,癌癥中低表達 CCR5 或者抑制 CCR5 與更好的預后相關。此外,CCR5 在高危 MDS 患者的 CD8+ T 細胞中增加,因此低表達 CCR5 的 MDS 患者可能提示有更好的預后,circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5)軸調節的 MDS 患者可能預后良好,但這還需要臨床研究進一步驗證。
綜上所述,本研究通過檢索 GEO 數據庫中 MDS 相關數據集,進行差異分析處理,從而構建 circRNA-miRNA-mRNA 網絡,以期探索 circRNA 在人類 MDS 的早期產生、發展演變過程中發揮的作用。circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9)可能是通過調節自噬,從而產生與 MDS 發生發展之間的聯系。circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(IRF4)軸可能抑制體液免疫和細胞免疫,從而減弱其抗腫瘤作用。circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5)軸調節的 MDS 患者可能預后良好。然而,本研究中所有工作的具體展開全盤依托于 GEO 數據庫,探討 circRNA 在 MDS 的發展演變過程中的分子機制仍需更進一步的研究來驗證。
利益沖突:所有作者聲明不存在利益沖突。
骨髓增生異常綜合征(myelodysplastic syndrome, MDS)是一組異質性顯著的髓系克隆性惡性疾病,其特征是無效造血、難治性外周血細胞進行性減少、進展為急性髓系白血病的風險增加和總生存率差[1]。MDS 在兒童期和青少年期發病并不常見,但隨著年齡的增長而發病率逐年上升[2]。環狀 RNA(circular RNA, circRNA)是借助高通量測序探索到的新型 RNA[3]。作為非編碼 RNA,不具有 5’帽和 3’自由末端,通過一種名為“反向剪接”的剪接機制從信使 RNA(messenger RNA, mRNA)的前體以閉環形式導出,已成 RNA 生物學的研究熱點[4-5]。在多種癌癥中,circRNA 調節重要的細胞過程,包括增殖、侵襲和轉移,circRNA 可以作為競爭性內源 RNA(competing endogenous RNA, ceRNA)發揮作用,ceRNA 充當編碼 RNA 和非編碼 RNA 之間的溝通橋梁,與微 RNA(microRNA, miRNA)競爭,從而形成跨轉錄組的調控網絡即 circRNA-miRNA-mRNA 軸[6-7]。近年來,circRNA 及其 ceRNA 網絡在 MDS 發生發展中的作用引起了人們的關注,本研究旨在通過生物信息學分析,篩選出差異表達的 circRNA 及 mRNA,構建 ceRNA 網絡,探索 circRNA 在 MDS 中的重要作用。
1 材料與方法
1.1 數據集的獲取和預處理
在 GEO(Gene Expression Omnibus)中選取 GSE163386 數據集(5 例 MDS 患者,5 例急性髓系白血病患者和 4 例對照患者的骨髓樣本)和 GSE94591 數據集(4 例健康對照者和 6 例急性髓系白血病患者)[8],因 GSE163386 數據集中的對照組為脾功能亢進、血小板減少以及白細胞減少的患者,且上述 2 個數據集的平臺注釋文件一致,遂本研究將上述 2 個數據集合并,在 R 4.2.1 環境下,將 GSE163386 數據集中的 5 例 MDS 患者的表達譜芯片數據、GSE94591 數據集中的 4 例健康對照者表達譜芯片數據進行合并,并處理合并后的數據集,最后得到 circRNA 的完整表達矩陣。對 GSE81173 數據集(6 例健康對照者和 12 例 MDS 患者)進行處理,得到 mRNA 的完整表達矩陣。
1.2 基于 limma 包進行差異分析
在 R 4.2.1 環境下,選擇 limma 包差異分析差異表達 circRNA、mRNA 表達矩陣,以校正 P<0.05 和|log2 差異倍數|≥2 為選擇標準,篩選出較顯著差異表達的 circRNA 和 mRNA。進一步以差異倍數>10 為 circRNA 的篩選條件,最后根據 circBase 數據庫對得到的 circRNA 進行標準化命名轉化。于表達矩陣找到 MDS 組與健康對照組中 circRNA 對應的表達量并用 pheatmap 包繪制聚類熱圖。
1.3 ceRNA 網絡的構建
利用人類 circRNA 信息數據庫 circBank 預測與上述差異倍數>10 的差異表達 circRNA 相互作用的 miRNA,進一步利用 ENCORI、miRDB、miRWalk 數據庫預測與上述差異表達 mRNA 相互作用的 miRNA,取二者交集,利用 Cytoscape 3.9.1 繪制 circRNA-miRNA-mRNA 軸的網絡圖。以“myelodysplastic syndrome”為關鍵詞,于 PubMed 中檢索得到與 MDS 有關的 miRNA,取交集進一步得到 MDS 相關的 ceRNA 網絡。
2 結果
2.1 MDS 中差異表達 circRNA 的篩選結果
通過分析 circRNA 表達矩陣,得到差異表達 circRNA 共 5397 個,篩選后得到較顯著差異表達 circRNA 共 128 個,其中 MDS 患者組高表達的 circRNA 有 48 個,MDS 患者組低表達的 circRNA 有 80 個。以差異倍數>10 再次處理數據,結果顯示 3 個表達上調(表1),11 個表達下調(表2)。MDS 組與健康對照組 circRNA 表達量的聚類熱圖見圖1。通過分析 mRNA 表達矩陣,得到差異表達 mRNA 共 19254 個,篩選后得到較顯著差異表達 mRNA 共 101 個,MDS 組中 9 個表達上調,92 個表達下調。



T 代表骨髓增生異常綜合征組;N 代表健康對照組。列為樣本表達譜;行為標準命名的環狀 RNA。紅色為表達上調,藍色為表達下調,白色為中等表達
2.2 ceRNA 網絡的構建結果
通過 circBank 預測的與差異表達 circRNA 相互作用的 miRNA 有 582 個,進一步通過 ENCORI、miRDB、miRWalk 數據庫預測的與差異表達 mRNA 相互作用的 miRNA 有 348 個,取交集得到均上調的 miRNA 有 1 個,均下調的 miRNA 有 72 個,構建 circRNA-miRNA-mRNA 軸(圖2)。構建的 circRNA-miRNA-mRNA 軸由 11 個 circRNA、73 個 miRNA、37 個 mRNA 組成。與 PubMed 檢索得到的 MDS 相關 miRNA 取交集進一步得到 MDS 相關的 ceRNA 網絡,即 circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9、SLC16A6)和 circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5、SLC16A6、IRF4),這些網絡均為下調表達。

藍色三角箭頭表示環狀 RNA,紅色菱形表示微 RNA,紫色圓形表示信使 RNA,黑色箭頭與線表示環狀 RNA-微 RNA,灰色箭頭與線表示微 RNA-信使 RNA,右下角為上調表達的競爭性內源 RNA 調控網絡,其余均為下調表達
3 討論
circRNA 是一種具有生物活性的核酸分子,以閉環 RNA 的形式存在,與 mRNA 不同,circRNA 缺少聚腺苷酸化的尾部[9]。盡管一些 circRNA 具有蛋白質編碼潛力,但常常被歸類為非編碼 RNA[10]。近年來,越來越多的研究揭示了 circRNA 在不同生物學過程中的重要作用,特別是在肺癌[11]、膀胱癌[12]、胃癌[13]、肝癌[14]等不同癌癥的發病機制、疾病進展過程以及癌細胞遷移中有著重要作用,這提示 circRNA 作為分子診斷生物標志物具有潛在意義。
MDS 是一種克隆性疾病,circRNA 在 MDS 中發揮重要作用。本研究通過處理 GEO 數據庫得到 GSE163386 和 GSE94591 這 2 個 circRNA 數據集,并結合 GSE81173 這 1 個 mRNA 數據集,構建 circRNA-miRNA-mRNA 軸,由 11 個 circRNA、73 個 miRNA、37 個 mRNA 組成。既往文獻報道,miR-16-5p 和 miR-125b-5p 為 MDS 的生物標志物[15]。本研究進一步得到 MDS 相關的 ceRNA 網絡即 circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9、SLC16A6)和 circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5、SLC16A6、IRF4),這些網絡均為下調。
circRNA 在癌癥發展和某些類型的病理反應中發揮著重要作用,充當 miRNA 海綿來調節基因表達,形成 circRNA-miRNA-mRNA 軸,也稱為 ceRNA 網絡[16]。RUBCNL 是一種蛋白質編碼基因,也被稱為 PACER、C13orf18 以及 KIAA0226,與 RUBCNL 相關的疾病包括宮頸癌和子宮原位癌。在營養豐富的條件下,RUBCNL 被哺乳動物雷帕霉素靶蛋白復合體 1 介導的磷酸化滅活,當營養不足時,RUBCNL 被去磷酸化,這有利于其乙酰化,而乙酰化的 RUBCNL 顯著增強同型融合和蛋白分選復合體的募集,最終導致體外和體內更有效的自噬體成熟和脂質代謝[17]。TBC1D9 也通過自噬發揮作用,是一種新型的自噬調節器,TBC1D9 通過鈣離子依賴的泛素識別來控制 TANK 結合激酶 1 在異體自噬和有絲分裂過程中的激活[18],而 TANK 結合激酶 1 活性失調通常不僅與傳染性疾病有關,還與自身免疫性疾病和癌癥有關,并且既往研究表明造血干細胞區室中缺失 ATG7 的小鼠具有 MDS 樣表型[19],因此自噬和線粒體功能障礙與 MDS 的發病機制有關。綜上,circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9)可能是通過調節自噬,從而產生與 MDS 發生發展之間的聯系,而 SLC16A6 是一種蛋白質編碼基因,別名為 MCT6、MCT7。SLC16A6 可以預測皮膚黑色素瘤的特異性生存[20],但是尚未發現該基因與血液系統疾病之間的聯系。
IRF4 在 B 細胞的發育分化和淋巴細胞的增殖活化中起重要作用,敲除 IRF4 后,小鼠活化的淋巴細胞和漿細胞數量明顯減少,血清免疫球蛋白水平顯著下降,T 淋巴細胞的細胞毒作用或抗腫瘤作用減弱[21]。IRF4 在 MDS 中低表達,circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(IRF4)軸通過誘導體液免疫和細胞免疫抑制,從而減弱機體抗腫瘤作用。
CCR5 基因編碼的蛋白是一種 G 蛋白偶聯受體,見于不同種類的癌,主要作用于癌癥進展的晚期事件(如腫瘤轉移),CCR5/CCL5 軸具有促腫瘤效應,故 CCR5 低表達與更好的預后相關[22]。Zilio 等[23]的研究也表明,癌癥中低表達 CCR5 或者抑制 CCR5 與更好的預后相關。此外,CCR5 在高危 MDS 患者的 CD8+ T 細胞中增加,因此低表達 CCR5 的 MDS 患者可能提示有更好的預后,circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5)軸調節的 MDS 患者可能預后良好,但這還需要臨床研究進一步驗證。
綜上所述,本研究通過檢索 GEO 數據庫中 MDS 相關數據集,進行差異分析處理,從而構建 circRNA-miRNA-mRNA 網絡,以期探索 circRNA 在人類 MDS 的早期產生、發展演變過程中發揮的作用。circRNA(has_circ_0061137)-miRNA(has-miR-16-5p)-mRNA(RUBCNL、TBC1D9)可能是通過調節自噬,從而產生與 MDS 發生發展之間的聯系。circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(IRF4)軸可能抑制體液免疫和細胞免疫,從而減弱其抗腫瘤作用。circRNA(has_circ_0061137)-miRNA(has-miR-125b-5p)-mRNA(CCR5)軸調節的 MDS 患者可能預后良好。然而,本研究中所有工作的具體展開全盤依托于 GEO 數據庫,探討 circRNA 在 MDS 的發展演變過程中的分子機制仍需更進一步的研究來驗證。
利益沖突:所有作者聲明不存在利益沖突。