引用本文: 章銳, 祝孔俊, 杜秋麗, 袁媛, 阮劍, 趙建國. 利用 TCGA 數據庫構建男性乳腺癌的lncRNA-miRNA-mRNA ceRNA 網絡. 中國普外基礎與臨床雜志, 2021, 28(3): 380-384. doi: 10.7507/1007-9424.202005027 復制
男性乳腺癌占所有乳腺癌的 0.5%~1%,美國每年大約有 2 000 名男性被診斷出乳房惡性腫瘤[1-2]。由于缺乏可靠的臨床證據,治療男性乳腺癌的標準通常是來自女性乳腺癌的大量文獻資料和臨床經驗,這些數據可能并不完全適用于男性,男性荷爾蒙環境可能是其獨特而強大的風險因素,也是治療結果和預后的決定因素[3]。在一項納入了 102 例意大利男性乳腺癌患者的研究中,未發現乳腺癌 1 號基因(BRCA1)或乳腺癌 2 號基因(BRCA2)重排[4],男性乳腺癌可能與 PALB2(partner and localizer of BRCA2)中的雄激素受體(AR)[5]、CYP17 基因編碼的 17α 羥化酶(CYP17)[6]和細胞周期檢測點激酶 2(CHEK2)[7-8]的突變存在一定的相關性。近幾年發現,非編碼的 RNA [長鏈非編碼 RNA(lncRNA)、微小 RNA(microRNA,miRNA)等]雖然不編碼蛋白質,但在正常的生理功能和病理生理的調控中發揮著重要的作用,例如 lncRNA 能夠作為肺癌診斷和預后的生物學標志物[9],miRNA 能參與基因表達調控[10]。Salmena 等[11]提出了競爭性內源 RNA(ceRNA)假說,并被后續實驗支持。該假設描述 miRNA 通過結合 mRNA 調控其表達,lncRNA 通過競爭吸附 miRNA 影響 miRNA 的功能[12],但是在男性乳腺癌中 ceRNA 的調控機制并不清楚。本研究對 TCGA 數據庫中含有男性乳腺癌和正常乳腺組織的轉錄組芯片數據進行分析,并構建 ceRNA 網絡,為研究男性乳腺癌的發病機制奠定一定的基礎。
1 臨床資料
1.1 樣本及數據分析
從 TCGA 數據庫中收集男性乳腺癌的 RNA 表達譜數據,挑選到正常男性乳腺組織 1 例,男性乳腺癌癌組織 12 例。癌組織和正常組織的 lncRNA、mRNA 和 miRNA 數據采用 R 軟件提取和標準化處理。
差異表達基因分析:將男性乳腺癌癌組織與正常男性乳腺組織進行差異表達基因分析,利用 R 軟件中的“limma”包,按照 |log2FC|>1(FC 表示2 組樣品間表達值的比值)、P<0.05,篩選差異基因。
1.2 GO 富集分析和 KEGG 通路分析
利用 DAVID 數據庫(The Database for Annotation,Visualization,and Integrated Discovery)將差異基因進行 GO(Gene Ontology)富集分析和 KEGG(KytoKyoto Encyclopedia of Genes and Genomes)通路分析。
1.3 男性乳腺癌 ceRNA 網絡構建
男性乳腺癌 ceRNA 網絡構建的具體方法參考文獻 [9, 13]。將差異 lncRNA 和 miRNA 在 miRcode 數據庫中進行配對,基于 miRDB、miRTarbase 和 Targetscan 數據庫,利用 starBase 在線軟件對篩選出的差異 miRNA 進行靶基因預測,得到 lncRNA-miRNA-mRNA 的 ceRNA 調控網絡數據,利用 Cytescape V3.5.2 軟件進行可視化分析,制作出 ceRNA 網絡圖。
1.4 結果
1.4.1 lncRNA、miRNA 和 mRNA 的差異性表達分析
根據 |log2FC|>1 并且 P<0.05 的篩選標準,比較男性乳腺癌癌組織和正常乳腺組織的基因表達量,分別得到差異性表達的 lncRNA、miRNA 和 mRNA。其中 lncRNA 有 275 種,miRNA 有 33 種,mRNA 有 1 675 種,見圖1a–1c 和表1。

a–c:lncRNA(a)、miRNA(b)和 mRNA(c)差異性表達的火山圖,FDR 為錯誤發現率,上調基因標記為紅色,下調基因標記為綠色;d:差異表達基因富集的前 10 個 GO 條目;e:差異表達基因參與的 9 條 KEGG 通路;f:lncRNA-miRNA-mRNA ceRNA 網絡,其中菱形代表 lncRNA,正方形代表 miRNA,圓形代表 mRNA,紅色為上調 RNA,綠色為下調 RNA;g:ceRNA 網絡中差異表達基因富集的前 10 個 GO 條目;h:ceRNA 網絡中差異表達基因參與的 4 條 KEGG 通路

1.4.2 差異表達 mRNA 的 GO 富集分析和 KEGG 通路分析
為了進一步檢測差異表達基因在男性乳腺癌中的潛在作用,進行了 mRNA 的 GO 富集分析和 KEGG 通路分析。結果發現,差異表達 mRNA 主要參與了 G 蛋白信號傳導、細胞增殖的負調控、對激素刺激的反應等生物學過程(圖1d),參與的 KEGG 通路包括過氧化物酶體增殖物激活受體(PPAR)、細胞黏附分子(CAMs)、胰島素信號通路等信號通路(圖1e)。
1.4.3 差異表達基因 ceRNA 網絡的構建
基于男性乳腺癌差異性表達的 lncRNA、miRNA 和 mRNA,本研究構建了 ceRNA 網絡。總共有 9 個 miRNA 節點,46 個 mRNA 節點,25 個 lncRNA 節點,其中與 hsa-miRNA-183 相互作用的 lnRNA 和 mRNA 種類最多,見圖1f。
1.4.4 ceRNA 網絡中差異表達基因 mRNA 的 GO 富集分析和 KEGG 通路分析
為了進一步檢測 ceRNA 網絡中 46 個差異表達 mRNA 在男性乳腺癌中的潛在作用,進行了 GO 富集分析和 KEGG 通路分析。結果發現,46 個差異表達 mRNA 主要參與了與轉錄因子活性、調節磷酸鹽代謝過程、細胞增殖的負調控、轉錄的負調控、細胞蛋白質代謝過程的調控、細胞遷移的調控、轉移酶活性的正調控、調控細胞增殖、激活蛋白激酶活性、間充質細胞增殖的正調控等(圖1g)。此外,4 條 KEGG 通路被激活,包括癌癥的途徑、白細胞跨內皮遷移、絲裂原活化蛋白激酶(MAPK)和神經營養蛋白信號通路(圖1h)。上述結果表明,差異表達基因可能在乳腺癌的發生和進展中起重要作用。
2 討論
美國國家癌癥研究所監測的流行病學數據顯示,1973 年至 2005 年期間的 5 494 例男性乳腺癌中有 92% 是雌激素受體(ER)陽性[14],但在 838 805 例女性乳腺癌中,只有 78% 是 ER 陽性[15]。在男性乳腺癌的免疫組織化學中發現,AR 陽性率為 34%~95%,雄激素途徑比女性乳腺癌更加活躍[16]。一項研究[17]還發現,催乳素受體也涉及男性乳腺癌的發生,但是針對男性乳腺癌的研究仍然不足,缺乏有效的早期診斷標志物,亟需加強對其分子水平的研究,尋找有效的治療靶點。
越來越多的證據表明,非編碼 RNA 在腫瘤的發生和發展中起著重要的調控作用,非編碼 RNA 通過多種途徑調節基因表達,從而促進腫瘤發生和腫瘤轉移[18]。本研究對 TCGA 數據庫中的表達譜芯片數據進行了分析,構建了 ceRNA 網絡,通過分析提取差異表達的 miRNA、mRNA 和 lncRNA。通過構建的 ceRNA,在既可以通過數據庫查詢相互作用關系的同時,也能確定這些基因是否是男性乳腺癌的差異基因,使分析結果更為準確[13]。lncRNA OSTN-AS1 以及相關的 ceRNA 調控機制[19]、端粒酶逆轉錄酶基因(TERT)、TRIML2(tripartite motif family-like 2)、PHBP4、miR-1-3p 及 miR-133a-3p5[20]在三陰性乳腺癌中可能是潛在的治療靶點和預后指標。lncRNA HCP5 通過 ceRNA 結合 miR-219a-5p,調控桿狀病毒 IAP 重復序列 3(BIRC3),影響三陰性乳腺癌細胞的增殖、凋亡、侵襲遷移,從而促進三陰性乳腺癌進展[21]。ceRNA 網絡中的 46 個差異表達基因,受到 lncRNA 和 miRNA 的調控,通過參與癌癥的途徑、白細胞跨內皮遷移、MAPK 和神經營養蛋白信號通路,從而影響男性乳腺癌的進展。
本研究構建的 ceRNA 網絡中有 9 個 miRNA 節點,與 lncRNA 和 mRNA 連接較多的為 hsa-miRNA-183、hsa-miRNA-182 和 hsa-miRNA-21。研究[22]證實,hsa-miR-183 的表達水平在乳腺癌中上調,miR-183-5p 的過表達顯著增強了 MCF-7 和 MDA-MB-231 細胞的細胞增殖,并抑制了細胞凋亡;hsa-miR-183 負調控程序性細胞死亡基因 4(PDCD4)的表達,PDCD4 的敲低抑制了 p21 和 p27 的表達,從而在乳腺癌中發揮致癌 miRNAs(oncogenic micRNA,oncomiRs)作用。hsa-miR-182 能通過靶向調控基因抑絲蛋白 1 基因(PFN1)促進三陰性乳腺癌的侵襲遷移[23],lncRNA AWPPH 和 miRNA-21 通過作用于 10 號染色體同源丟失性磷酸酶-張力蛋白基因(phosphase and tensin homology deleted on chromosome ten,PTEN)來調節三陰性乳腺癌細胞的增殖和化學敏感性[24-25]。通過 TCGA 男性乳腺癌表達譜數據構建的 ceRNA 網絡中男性乳腺癌高表達的 6 種 mRNA—跨膜 γ 羧基酸蛋白 4 基因(PRRG4)、RalA GTP 酶的鳥嘌呤核苷酸交換因子 2 基因(RALGPS2)、包含 α/β 水解酶結構域的蛋白 17C 基因(ABHD17C)、埃茲蛋白基因(EZR)、細胞周期蛋白 B1 基因(CCNB1)和分配缺陷蛋白 6B 基因(partitioning defective protein 6B,PARD6B)中,EZR[26]、CCNB1[27]和 PARD6B[28]是女性乳腺癌的重要預后因素,而 PRRG4、RALGPS2 和 ABHD17C 在乳腺癌中少有文獻研究。男性乳腺癌 ceRNA 網絡中的 miRNA 和相關的 lncRNA 和 mRNA 構成重要的腫瘤調節通路,雖然目前暫缺乏驗證,但是隨著男性乳腺癌更加深入的研究,在進一步的實驗和大量數據驗證后將會對男性乳腺癌的發病機制有更進一步的了解。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:章銳作為第一作者,主要參與文章撰寫和分析工作;趙建國作為通信作者,主要參與擬定研究方向及修訂文稿;祝孔俊、杜秋麗、袁媛和阮劍參與分析及修訂工作。
男性乳腺癌占所有乳腺癌的 0.5%~1%,美國每年大約有 2 000 名男性被診斷出乳房惡性腫瘤[1-2]。由于缺乏可靠的臨床證據,治療男性乳腺癌的標準通常是來自女性乳腺癌的大量文獻資料和臨床經驗,這些數據可能并不完全適用于男性,男性荷爾蒙環境可能是其獨特而強大的風險因素,也是治療結果和預后的決定因素[3]。在一項納入了 102 例意大利男性乳腺癌患者的研究中,未發現乳腺癌 1 號基因(BRCA1)或乳腺癌 2 號基因(BRCA2)重排[4],男性乳腺癌可能與 PALB2(partner and localizer of BRCA2)中的雄激素受體(AR)[5]、CYP17 基因編碼的 17α 羥化酶(CYP17)[6]和細胞周期檢測點激酶 2(CHEK2)[7-8]的突變存在一定的相關性。近幾年發現,非編碼的 RNA [長鏈非編碼 RNA(lncRNA)、微小 RNA(microRNA,miRNA)等]雖然不編碼蛋白質,但在正常的生理功能和病理生理的調控中發揮著重要的作用,例如 lncRNA 能夠作為肺癌診斷和預后的生物學標志物[9],miRNA 能參與基因表達調控[10]。Salmena 等[11]提出了競爭性內源 RNA(ceRNA)假說,并被后續實驗支持。該假設描述 miRNA 通過結合 mRNA 調控其表達,lncRNA 通過競爭吸附 miRNA 影響 miRNA 的功能[12],但是在男性乳腺癌中 ceRNA 的調控機制并不清楚。本研究對 TCGA 數據庫中含有男性乳腺癌和正常乳腺組織的轉錄組芯片數據進行分析,并構建 ceRNA 網絡,為研究男性乳腺癌的發病機制奠定一定的基礎。
1 臨床資料
1.1 樣本及數據分析
從 TCGA 數據庫中收集男性乳腺癌的 RNA 表達譜數據,挑選到正常男性乳腺組織 1 例,男性乳腺癌癌組織 12 例。癌組織和正常組織的 lncRNA、mRNA 和 miRNA 數據采用 R 軟件提取和標準化處理。
差異表達基因分析:將男性乳腺癌癌組織與正常男性乳腺組織進行差異表達基因分析,利用 R 軟件中的“limma”包,按照 |log2FC|>1(FC 表示2 組樣品間表達值的比值)、P<0.05,篩選差異基因。
1.2 GO 富集分析和 KEGG 通路分析
利用 DAVID 數據庫(The Database for Annotation,Visualization,and Integrated Discovery)將差異基因進行 GO(Gene Ontology)富集分析和 KEGG(KytoKyoto Encyclopedia of Genes and Genomes)通路分析。
1.3 男性乳腺癌 ceRNA 網絡構建
男性乳腺癌 ceRNA 網絡構建的具體方法參考文獻 [9, 13]。將差異 lncRNA 和 miRNA 在 miRcode 數據庫中進行配對,基于 miRDB、miRTarbase 和 Targetscan 數據庫,利用 starBase 在線軟件對篩選出的差異 miRNA 進行靶基因預測,得到 lncRNA-miRNA-mRNA 的 ceRNA 調控網絡數據,利用 Cytescape V3.5.2 軟件進行可視化分析,制作出 ceRNA 網絡圖。
1.4 結果
1.4.1 lncRNA、miRNA 和 mRNA 的差異性表達分析
根據 |log2FC|>1 并且 P<0.05 的篩選標準,比較男性乳腺癌癌組織和正常乳腺組織的基因表達量,分別得到差異性表達的 lncRNA、miRNA 和 mRNA。其中 lncRNA 有 275 種,miRNA 有 33 種,mRNA 有 1 675 種,見圖1a–1c 和表1。

a–c:lncRNA(a)、miRNA(b)和 mRNA(c)差異性表達的火山圖,FDR 為錯誤發現率,上調基因標記為紅色,下調基因標記為綠色;d:差異表達基因富集的前 10 個 GO 條目;e:差異表達基因參與的 9 條 KEGG 通路;f:lncRNA-miRNA-mRNA ceRNA 網絡,其中菱形代表 lncRNA,正方形代表 miRNA,圓形代表 mRNA,紅色為上調 RNA,綠色為下調 RNA;g:ceRNA 網絡中差異表達基因富集的前 10 個 GO 條目;h:ceRNA 網絡中差異表達基因參與的 4 條 KEGG 通路

1.4.2 差異表達 mRNA 的 GO 富集分析和 KEGG 通路分析
為了進一步檢測差異表達基因在男性乳腺癌中的潛在作用,進行了 mRNA 的 GO 富集分析和 KEGG 通路分析。結果發現,差異表達 mRNA 主要參與了 G 蛋白信號傳導、細胞增殖的負調控、對激素刺激的反應等生物學過程(圖1d),參與的 KEGG 通路包括過氧化物酶體增殖物激活受體(PPAR)、細胞黏附分子(CAMs)、胰島素信號通路等信號通路(圖1e)。
1.4.3 差異表達基因 ceRNA 網絡的構建
基于男性乳腺癌差異性表達的 lncRNA、miRNA 和 mRNA,本研究構建了 ceRNA 網絡。總共有 9 個 miRNA 節點,46 個 mRNA 節點,25 個 lncRNA 節點,其中與 hsa-miRNA-183 相互作用的 lnRNA 和 mRNA 種類最多,見圖1f。
1.4.4 ceRNA 網絡中差異表達基因 mRNA 的 GO 富集分析和 KEGG 通路分析
為了進一步檢測 ceRNA 網絡中 46 個差異表達 mRNA 在男性乳腺癌中的潛在作用,進行了 GO 富集分析和 KEGG 通路分析。結果發現,46 個差異表達 mRNA 主要參與了與轉錄因子活性、調節磷酸鹽代謝過程、細胞增殖的負調控、轉錄的負調控、細胞蛋白質代謝過程的調控、細胞遷移的調控、轉移酶活性的正調控、調控細胞增殖、激活蛋白激酶活性、間充質細胞增殖的正調控等(圖1g)。此外,4 條 KEGG 通路被激活,包括癌癥的途徑、白細胞跨內皮遷移、絲裂原活化蛋白激酶(MAPK)和神經營養蛋白信號通路(圖1h)。上述結果表明,差異表達基因可能在乳腺癌的發生和進展中起重要作用。
2 討論
美國國家癌癥研究所監測的流行病學數據顯示,1973 年至 2005 年期間的 5 494 例男性乳腺癌中有 92% 是雌激素受體(ER)陽性[14],但在 838 805 例女性乳腺癌中,只有 78% 是 ER 陽性[15]。在男性乳腺癌的免疫組織化學中發現,AR 陽性率為 34%~95%,雄激素途徑比女性乳腺癌更加活躍[16]。一項研究[17]還發現,催乳素受體也涉及男性乳腺癌的發生,但是針對男性乳腺癌的研究仍然不足,缺乏有效的早期診斷標志物,亟需加強對其分子水平的研究,尋找有效的治療靶點。
越來越多的證據表明,非編碼 RNA 在腫瘤的發生和發展中起著重要的調控作用,非編碼 RNA 通過多種途徑調節基因表達,從而促進腫瘤發生和腫瘤轉移[18]。本研究對 TCGA 數據庫中的表達譜芯片數據進行了分析,構建了 ceRNA 網絡,通過分析提取差異表達的 miRNA、mRNA 和 lncRNA。通過構建的 ceRNA,在既可以通過數據庫查詢相互作用關系的同時,也能確定這些基因是否是男性乳腺癌的差異基因,使分析結果更為準確[13]。lncRNA OSTN-AS1 以及相關的 ceRNA 調控機制[19]、端粒酶逆轉錄酶基因(TERT)、TRIML2(tripartite motif family-like 2)、PHBP4、miR-1-3p 及 miR-133a-3p5[20]在三陰性乳腺癌中可能是潛在的治療靶點和預后指標。lncRNA HCP5 通過 ceRNA 結合 miR-219a-5p,調控桿狀病毒 IAP 重復序列 3(BIRC3),影響三陰性乳腺癌細胞的增殖、凋亡、侵襲遷移,從而促進三陰性乳腺癌進展[21]。ceRNA 網絡中的 46 個差異表達基因,受到 lncRNA 和 miRNA 的調控,通過參與癌癥的途徑、白細胞跨內皮遷移、MAPK 和神經營養蛋白信號通路,從而影響男性乳腺癌的進展。
本研究構建的 ceRNA 網絡中有 9 個 miRNA 節點,與 lncRNA 和 mRNA 連接較多的為 hsa-miRNA-183、hsa-miRNA-182 和 hsa-miRNA-21。研究[22]證實,hsa-miR-183 的表達水平在乳腺癌中上調,miR-183-5p 的過表達顯著增強了 MCF-7 和 MDA-MB-231 細胞的細胞增殖,并抑制了細胞凋亡;hsa-miR-183 負調控程序性細胞死亡基因 4(PDCD4)的表達,PDCD4 的敲低抑制了 p21 和 p27 的表達,從而在乳腺癌中發揮致癌 miRNAs(oncogenic micRNA,oncomiRs)作用。hsa-miR-182 能通過靶向調控基因抑絲蛋白 1 基因(PFN1)促進三陰性乳腺癌的侵襲遷移[23],lncRNA AWPPH 和 miRNA-21 通過作用于 10 號染色體同源丟失性磷酸酶-張力蛋白基因(phosphase and tensin homology deleted on chromosome ten,PTEN)來調節三陰性乳腺癌細胞的增殖和化學敏感性[24-25]。通過 TCGA 男性乳腺癌表達譜數據構建的 ceRNA 網絡中男性乳腺癌高表達的 6 種 mRNA—跨膜 γ 羧基酸蛋白 4 基因(PRRG4)、RalA GTP 酶的鳥嘌呤核苷酸交換因子 2 基因(RALGPS2)、包含 α/β 水解酶結構域的蛋白 17C 基因(ABHD17C)、埃茲蛋白基因(EZR)、細胞周期蛋白 B1 基因(CCNB1)和分配缺陷蛋白 6B 基因(partitioning defective protein 6B,PARD6B)中,EZR[26]、CCNB1[27]和 PARD6B[28]是女性乳腺癌的重要預后因素,而 PRRG4、RALGPS2 和 ABHD17C 在乳腺癌中少有文獻研究。男性乳腺癌 ceRNA 網絡中的 miRNA 和相關的 lncRNA 和 mRNA 構成重要的腫瘤調節通路,雖然目前暫缺乏驗證,但是隨著男性乳腺癌更加深入的研究,在進一步的實驗和大量數據驗證后將會對男性乳腺癌的發病機制有更進一步的了解。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:章銳作為第一作者,主要參與文章撰寫和分析工作;趙建國作為通信作者,主要參與擬定研究方向及修訂文稿;祝孔俊、杜秋麗、袁媛和阮劍參與分析及修訂工作。