引用本文: 奧偉, 殷德濤. 運用生物信息學篩選甲狀腺乳頭狀癌生物靶點. 中國普外基礎與臨床雜志, 2021, 28(3): 329-335. doi: 10.7507/1007-9424.202006044 復制
甲狀腺癌(TC)是最常見的頭頸部惡性腫瘤之一[1],其中最常見的類型是甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC),占所有 TC 病例的 70%~80%[2]。目前,PTC 的病因尚不十分清楚,認為其可能與電離輻射、碘攝取異常、促甲狀腺激素(TSH)慢性刺激、雌激素異常、肥胖等有關[3]。早期 PTC 的臨床表現不甚明顯,僅有彩色多普勒檢查提示頸部包塊或結節等征象。另一方面,不可否認的是,盡管 PTC 有著惰性的生物學特征,在日漸規范的手術切除術式及放射性碘(radioactive iodine,RAI)治療后大部分患者預后良好,但仍然呈現出部分患者有較大的原發灶、淋巴結轉移及全身骨轉移的特征[4],行腫瘤姑息手術后的患者若不能攝取放射性碘或放射性碘攝取差,則其放射性碘治療效果極差,甚至影響生存壽命。
隨著基因組學及轉錄組學的快速發展,各項研究技術被運用于分子生物學領域,其中高通量基因表達測序技術憑借規模大、樣本需求量小、測序時間短、準確等特點,幫助國內外科研人員獲得了海量研究數據。基于技術的革新與數據共享時代的來臨,人們對 TC 發生發展的分子機制的研究越加深入,一系列的分子靶向藥物隨之而來,如索拉非尼等。與此同時,新的問題隨之產生,大多數腫瘤的發生發展與基因突變密切相關,往往涉及不止一個藥物作用靶點,因此單一作用靶點的靶向治療很難達到根治的目的;而且隨著治療時間的延長,腫瘤細胞可能發生新的基因突變型,產生相應的耐藥機制,比如 Herceptin(郝賽汀),是一種廣泛用于治療 HER2 陽性乳腺癌患者的單抗靶向藥物,但有 50% 以上的乳腺癌患者在用藥 1 年內對其治療產生耐藥[5]。因此進一步了解 PTC 發生發展的生物分子機制,尋找新的臨床病理特征判斷依據及預后評價、靶向治療的新分子靶點,顯得尤為重要。
1 資料與方法
1.1 微陣列數據
在基因表達綜合數據庫(GEO,Affymetrix GPL570 平臺,Affymetrix GPL13607 平臺)選取了 3 個基因表達數據集(GSE3467、GSE33630 和 GSE50901),只篩選了其中符合條件(PTC)的樣本數據。根據平臺中的注釋信息,將探針轉換為相應的基因符號。GSE3467 數據集包含 9 個 PTC 組織樣本和 9 個非癌性樣本;GSE33630 包含 49 個 PTC 樣本和 45 個非癌性樣本;GSE50901 包含 61 個 PTC 樣本和 13 個非癌性樣本。
1.2 差異表達基因(the differentially expressed genes,DEGs)的篩選
使用 GEO2R 篩選 PTC 和非癌性樣本之間的 DEGs。由于生信信息學分析假陽性率較高,通過校正后的 P 值以及 Benjamini-Hochberg 法計算得到的錯誤發現率(false discover rate,FDR)在統計學意義上顯著的基因發現與假陽性限制之間取得平衡。以|logFC(fold change)|>1 且校正后的 P 值<0.01 被認為具有統計學意義。
1.3 DEGs 的 KEGG 和 GO 富集分析
為了分析 DEGs 的功能,使用 DAVID 在線數據庫對 DEGs 進行了 KEGG 和 GO 富集分析。P<0.05 被認為具有統計學意義。
1.4 蛋白互作(PPI)網絡構建和分析
在本研究中,使用在線數據庫(STRING,
1.5 關鍵基因的分析
本研究通過下載 TCGA 數據庫中 TC 的 mRNA 表達譜,只選取 PTC 類型的樣本,然后用 R 計算數據集中每個關鍵基因與其他所有基因的皮爾遜相關系數(Pearson correlation coefficient),以其絕對值大于 0.8 為標準篩選關鍵基因相關的共表達基因。然后將其與關鍵基因利用 STRING 在線數據庫繪制出關鍵基因及其共表達基因相關的基因互作網絡圖。無復發生存期(recurrence-free-survival,RFS):從初次手術當日到首次區域或遠處淋巴結轉移復發的時間間隔,或發生對側新發癌灶或至病患死亡。利用 R 的 survminer 包根據關鍵基因的表達量進行分組,然后分析其與 RFS 的關系。使用 Benjaminiand-Hochberg 法對得到的假設檢驗 P 值做多重檢驗校正。使用 UCSC 癌癥基因組學瀏覽器(
2 結果
2.1 DEGs 的篩選結果
在 3 個基因表達數據集分別篩選出 DEGs:GSE3467 中 654 個,GSE33630 中 1 238 個和 GSE50901 中 1 211 個。3 個數據集所有差異基因之間的重疊包含 339 個基因,如 Venn 圖(圖 1a)所示,包括 189 個上調基因和 150 個下調的 PTC 組織和非腫瘤組織之間的基因。

a:Venn 圖,以|logFC|>1 且校正后的
2.2 DEGs 的 KEGG 和 GO 富集分析結果
為了對 DEGs 進行生物學分類分析,使用 DAVID 對其進行了功能和途徑富集分析。其中 GO 分析結果表明,上調的 DEGs 的生物學過程的改變明顯富集在細胞外基質降解、血管生成、MAPK 信號通路相關酶的活性和細胞間及細胞對胞外成分的反應;而下調的 DEGs 主要參與的生物學過程是在甲狀腺激素等激素的生物合成、RAS 信號通路的限制酶的活性、離子穩態的調節及細胞轉錄的調控。KEGG 途徑分析結果表明,上調的 DEGs 主要涉及的生物學通路為補體和凝血級聯反應過程、涉及細胞對胞外成分的反應的細胞外基質(ECM) 受體相互作用、磷脂酰肌醇 3-激酶/V-AKT 小鼠胸腺瘤病毒同源癌基因(PI3K-Akt)信號通路及其下游的 p53 信號通路,下調的 DEGs 主要參與的生物學通路為甲狀腺激素的合成、酪氨酸代謝、礦物吸收等(表 1)。

2.3 PPI 網絡構建和分析結果
構建 DEGs 的 PPI 網絡(圖 1b),使用 Cytoscape 獲得了最重要的子模塊(圖 1c)并篩選出了 10 個關鍵基因,即纖維連接蛋白 1(FN1)、細胞周期蛋白 D1(CCND1)、金屬肽酶抑制劑 1(TIMP1)、細胞間黏附分子 1(ICAM1)、載脂蛋白E (APOE)、MET(原癌基因 MET,酪氨酸激酶受體)、RUNX 家族轉錄因子 2(RUNX2)、角蛋白 19(KRT19)、KIT(原癌基因 KIT,酪氨酸蛋白激酶)和絲氨酸蛋白酶抑制蛋白家族 A 成員 1(SERPINA1),并對 DEGs 進行了基因富集的 GO 條目的分析以及可視化(圖 1d)。
2.4 關鍵基因相互作用網絡及功能分析結果
利用 STRING 在線數據庫繪制出 10 個關鍵基因及其共表達基因相關的基因互作網絡圖(圖 1e)。隨后通過 R 分析這 10 個關鍵基因與 RFS 的關系(圖 2a-2j),然后再使用 Benjaminiand-Hochberg 法對得到的假設檢驗 P 值做多重檢驗校正,可得 APOE(FDR=0.047 5)以及 KIT(FDR=0.042 0)基因表達的改變對 PTC 患者的 RFS 有一定的影響,具有統計學意義。同時使用 UCSC 癌癥基因組學瀏覽器(

a–j:分別表示 10 個關鍵基因表達水平與 RFS 的關系,
3 討論
本研究一共篩選出 339 個 PTC 和正常甲狀腺組織差異表達基因,包括 189 個上調基因和 150 個下調的 PTC 組織和非腫瘤組織之間的基因。GO 分析結果表明,上調的 DEGs 的生物學過程的改變明顯富集在細胞外基質降解、血管生成、MAPK 信號通路相關酶的活性和細胞間及細胞對胞外成分的反應。而下調的 DEGs 主要參與的生物學過程在甲狀腺激素的生物合成、RAS 信號通路的限制酶的活性、離子穩態的調節及細胞轉錄的調控。KEGG 途徑分析結果表明,上調的 DEGs 主要涉及的生物學通路為補體和凝血級聯反應過程、涉及細胞對胞外成分的反應的 ECM 受體相互作用、PI3K-Akt 信號通路及其下游的 p53 信號通路,下調的 DEGs 主要參與的生物學通路為甲狀腺激素的合成、酪氨酸代謝、礦物吸收等。而細胞外基質成分的降解通過激活不同的細胞信號通路,加快了腫瘤細胞的轉化和轉移過程[6]。其中細胞間及細胞與細胞外基質的相互作用可能涉及整合素結合、ECM 受體相互作用、細胞黏附等生物學途徑及 Notch 信號通路。此外,PTC 的發生發展可能與雌激素異常相關。分化良好的 TC,女性患者明顯多于男性患者。實驗證實,雌激素受體(ER)確實存在于 TC 組織中[7]。在細胞免疫調節、增殖、分化等過程中,白細胞介素(Interleukin,IL)發揮了重要作用,這與 PTC 的發生發展密切相關[8-9]。另外,本研究發現機體炎癥反應中的補體激活也可能參與到了癌癥的發生發展中。
PTC 的分子遺傳學研究目前主要集中在與腫瘤發生發展密切相關的信號通路上。信號通路是指分子信號介導胞外與細胞相互作用,引發細胞內一系列酶促級聯反應的通路。目前,絲裂原激活的蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路與磷脂酰肌醇 3-激酶/V-AKT、PI3K-Akt 信號通路已被證明與 PTC 發生發展密切相關[10]。MAPK 信號通路主要涉及 BRAF 基因、RAS 基因、ALK 基因、MEK 基因、ERK 基因等。當細胞外的刺激信號結合相應的細胞表面受體時,可激活受體細胞內部分蛋白激酶發揮功能,進而激活 RAS 基因,隨之激活 BREF 基因,繼續活化下游的 MEK 基因和 ERK 基因[11]。這與本研究差異基因 GO 分析出的 ERK1 和 ERK2 級聯調節、RPTK-Ras 信號通路等相一致。另外,ALK 可能通過引起 BRAF 激酶結構域異常表達影響該通路。在 PI3K-Akt 信號通路中,Akt 有多種方式磷酸化激活下游靶蛋白。一方面可活化 IκB 激酶,該激酶能夠降解核因子 NF-κB 的抑制劑 IκB,有證據表明核因子 NF-κB 通路也與甲狀腺癌的發生發展密切相關。另一方面,AKT 可通過抑制蛋白水解酶 Caspase-9 的激活阻止凋亡級聯反應發生。此外,腫瘤抑制因子 p53 為一介導內源性凋亡信號通路的轉錄因子。AKT 可磷酸化 p53 的結合蛋白 MDM2,進而使其轉位到細胞核中,結合 p53,促進其降解,影響細胞存活。此外對于 PTC,果蠅 WNT 同源基因/β-連鎖蛋白(Wnt/β-catenin)通路、轉化生長因子 β(TGF-β)通路以及 Notch 信號通路等也有重要意義。
構建 PPI 網絡圖后篩選出 10 個基因,即 FN1、CCND1、TIMP1、ICAM1、APOE、MET、RUNX2、KRT19、KIT 和 SERPINA1。
FN1 與腫瘤的發生發展密切相關,但在腫瘤中的功能卻存在爭議。一方面,FN1 可通過結合整合素,以 FAK、RAS 等途徑促進 MMP2/MMP9 的表達,從而促進卵巢癌和乳腺癌的生長、侵襲和轉移[12-13]。相關研究[14]表明,人表皮生長因子受體 2(HER2)可以通過 MEK 及 ERK 通路誘導 FN1 的表達,增加乳腺癌的遷移和侵襲能力。該途徑與 PTC 發生發展密切相關,提示 FN1 可能作為 PTC 靶向治療的新靶點。另一方面,FN1 又作為一個抑癌基因的角色出現在胃癌和結直腸癌腫瘤組織中。
CCND1 是細胞周期蛋白的重要成員之一,既往實驗表明其與 PTC 的惡性細胞增殖密切相關,與 PTC 淋巴結轉移無明顯關聯性[15],但也有研究[16]發現,CCND1 的陽性表達等因素是 PTC 出現淋巴結轉移和預后較差的危險因子,有待進一步研究。
TIMP1,相關研究[17]表明,TIMP1 作為關鍵靶基因,參與 MMPs 的轉錄后調控。主要通過與 MMPs 蛋白結合,降低其表達能力,這對 PTC 細胞遷移和侵襲的能力起到重要作用。
ICAM1,實驗[18]表明,一方面 ICAM-1 的上調與腫瘤的侵襲性特征如 BRAFV600E突變、ETE 和淋巴結轉移相關,其表達隨著腫瘤惡性程度的增高而增強,這提示 ICAM-1 在 PTC 的進展中起作用,且可作為判定腫瘤侵襲的指標之一。另一方面,相關實驗[19]表明, ICAM-1 僅在 PTC 中高表達,在甲狀腺濾泡狀癌、濾泡狀腺瘤和腺瘤樣甲狀腺腫中無表達,這有助于乳頭狀癌和濾泡狀癌兩種甲狀腺惡性腫瘤的鑒別診斷。
MET,Ramirez 等[20]用免疫組化方法證實分化型甲狀腺癌 C-MET 蛋白表達水平明顯高于甲狀腺良性腫瘤及正常組織。此外相關研究[21]表明,C-MET 蛋白表達強度與 PTC 轉移風險有關,體現在 C-MET 蛋白強表達組多合并有頸部淋巴結轉移,且癌灶突破包膜和周圍組織侵犯比例高。這些證據提示 MET 基因為臨床預后提供了一個良好的參考標準。
RUNX2,龔婷等[22]研究發現,RUNX2 在 PTC 中的表達水平的高低與腫瘤大小密切相關,在較大的癌灶中表達較高。RUNX2 可能與 PTC 內鈣化灶的產生及癌的發生發展有關,在其他的惡性腫瘤(如乳腺癌、前列腺癌、骨肉瘤)也有相關研究。此外,有研究[23]表明 RUNX2 是 miR-218 的直接靶標,可通過抑制其表達,抑制體內腫瘤生長,阻斷 PTEN-PI3K-Akt 途徑。
KRT19,在多種腫瘤發生發展中起重要作用,但在 PTC 中的作用尚不清楚。Wang 等[24]研究表明,KRT19 的表達僅在含有 B-Raf 原癌基因、絲氨酸/蘇氨酸激酶(BRAF)V600E 突變和 BRAFV600E過表達的腫瘤中增加。進而推測 BRAFV600E誘導的 KRT19 表達可能通過促進上皮間質轉化(EMT)促進 PTC 的轉移。
KIT 作為細胞因子 KITLG/SCF 的細胞表面受體,可激活多種信號通路,對調節細胞存活和增殖、細胞遷移等起重要作用。相關研究[25]表明,以該基因為靶點通過尿微生物可用于診斷乳腺癌,這意味著該基因可能作為新的 PTC 治療靶點。
SERPINA1,相關文獻[26]表明該基因可作為篩選 PTC 的靶點,準確區分 PTC 和良性結節。
APOE(載脂蛋白 E)是血漿脂蛋白的核心成分,參與其產生、轉化和清除,并在腫瘤微環境中誘導炎癥免疫反應。相關研究[27]表明其可作為評估非小細胞肺癌(NSCLC)淋巴結轉移的有效指標。此外,研究[28]發現在前列腺增生與前列腺癌之間,載脂蛋白E差異顯著。這意味著其可能是一種潛在的某些癌癥的生物標記物。
綜上,本研究旨在尋找 PTC 新的臨床病理特征判斷依據以及預后評價和靶向治療的新分子靶點,共篩選出 339 個 DEGs 及 10 個關鍵基因。但仍需要進一步的研究來具體闡明這些基因在 PTC 發生發展過程中的生物作用機制。
重要聲明
利益沖突聲明:作者聲明,該研究工作沒有利益沖突。
作者貢獻聲明:奧偉參與數據整理、分析、方法論、驗證及撰寫初稿;殷德濤參與概念化、監督和寫作審查和編輯。
甲狀腺癌(TC)是最常見的頭頸部惡性腫瘤之一[1],其中最常見的類型是甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC),占所有 TC 病例的 70%~80%[2]。目前,PTC 的病因尚不十分清楚,認為其可能與電離輻射、碘攝取異常、促甲狀腺激素(TSH)慢性刺激、雌激素異常、肥胖等有關[3]。早期 PTC 的臨床表現不甚明顯,僅有彩色多普勒檢查提示頸部包塊或結節等征象。另一方面,不可否認的是,盡管 PTC 有著惰性的生物學特征,在日漸規范的手術切除術式及放射性碘(radioactive iodine,RAI)治療后大部分患者預后良好,但仍然呈現出部分患者有較大的原發灶、淋巴結轉移及全身骨轉移的特征[4],行腫瘤姑息手術后的患者若不能攝取放射性碘或放射性碘攝取差,則其放射性碘治療效果極差,甚至影響生存壽命。
隨著基因組學及轉錄組學的快速發展,各項研究技術被運用于分子生物學領域,其中高通量基因表達測序技術憑借規模大、樣本需求量小、測序時間短、準確等特點,幫助國內外科研人員獲得了海量研究數據。基于技術的革新與數據共享時代的來臨,人們對 TC 發生發展的分子機制的研究越加深入,一系列的分子靶向藥物隨之而來,如索拉非尼等。與此同時,新的問題隨之產生,大多數腫瘤的發生發展與基因突變密切相關,往往涉及不止一個藥物作用靶點,因此單一作用靶點的靶向治療很難達到根治的目的;而且隨著治療時間的延長,腫瘤細胞可能發生新的基因突變型,產生相應的耐藥機制,比如 Herceptin(郝賽汀),是一種廣泛用于治療 HER2 陽性乳腺癌患者的單抗靶向藥物,但有 50% 以上的乳腺癌患者在用藥 1 年內對其治療產生耐藥[5]。因此進一步了解 PTC 發生發展的生物分子機制,尋找新的臨床病理特征判斷依據及預后評價、靶向治療的新分子靶點,顯得尤為重要。
1 資料與方法
1.1 微陣列數據
在基因表達綜合數據庫(GEO,Affymetrix GPL570 平臺,Affymetrix GPL13607 平臺)選取了 3 個基因表達數據集(GSE3467、GSE33630 和 GSE50901),只篩選了其中符合條件(PTC)的樣本數據。根據平臺中的注釋信息,將探針轉換為相應的基因符號。GSE3467 數據集包含 9 個 PTC 組織樣本和 9 個非癌性樣本;GSE33630 包含 49 個 PTC 樣本和 45 個非癌性樣本;GSE50901 包含 61 個 PTC 樣本和 13 個非癌性樣本。
1.2 差異表達基因(the differentially expressed genes,DEGs)的篩選
使用 GEO2R 篩選 PTC 和非癌性樣本之間的 DEGs。由于生信信息學分析假陽性率較高,通過校正后的 P 值以及 Benjamini-Hochberg 法計算得到的錯誤發現率(false discover rate,FDR)在統計學意義上顯著的基因發現與假陽性限制之間取得平衡。以|logFC(fold change)|>1 且校正后的 P 值<0.01 被認為具有統計學意義。
1.3 DEGs 的 KEGG 和 GO 富集分析
為了分析 DEGs 的功能,使用 DAVID 在線數據庫對 DEGs 進行了 KEGG 和 GO 富集分析。P<0.05 被認為具有統計學意義。
1.4 蛋白互作(PPI)網絡構建和分析
在本研究中,使用在線數據庫(STRING,
1.5 關鍵基因的分析
本研究通過下載 TCGA 數據庫中 TC 的 mRNA 表達譜,只選取 PTC 類型的樣本,然后用 R 計算數據集中每個關鍵基因與其他所有基因的皮爾遜相關系數(Pearson correlation coefficient),以其絕對值大于 0.8 為標準篩選關鍵基因相關的共表達基因。然后將其與關鍵基因利用 STRING 在線數據庫繪制出關鍵基因及其共表達基因相關的基因互作網絡圖。無復發生存期(recurrence-free-survival,RFS):從初次手術當日到首次區域或遠處淋巴結轉移復發的時間間隔,或發生對側新發癌灶或至病患死亡。利用 R 的 survminer 包根據關鍵基因的表達量進行分組,然后分析其與 RFS 的關系。使用 Benjaminiand-Hochberg 法對得到的假設檢驗 P 值做多重檢驗校正。使用 UCSC 癌癥基因組學瀏覽器(
2 結果
2.1 DEGs 的篩選結果
在 3 個基因表達數據集分別篩選出 DEGs:GSE3467 中 654 個,GSE33630 中 1 238 個和 GSE50901 中 1 211 個。3 個數據集所有差異基因之間的重疊包含 339 個基因,如 Venn 圖(圖 1a)所示,包括 189 個上調基因和 150 個下調的 PTC 組織和非腫瘤組織之間的基因。

a:Venn 圖,以|logFC|>1 且校正后的
2.2 DEGs 的 KEGG 和 GO 富集分析結果
為了對 DEGs 進行生物學分類分析,使用 DAVID 對其進行了功能和途徑富集分析。其中 GO 分析結果表明,上調的 DEGs 的生物學過程的改變明顯富集在細胞外基質降解、血管生成、MAPK 信號通路相關酶的活性和細胞間及細胞對胞外成分的反應;而下調的 DEGs 主要參與的生物學過程是在甲狀腺激素等激素的生物合成、RAS 信號通路的限制酶的活性、離子穩態的調節及細胞轉錄的調控。KEGG 途徑分析結果表明,上調的 DEGs 主要涉及的生物學通路為補體和凝血級聯反應過程、涉及細胞對胞外成分的反應的細胞外基質(ECM) 受體相互作用、磷脂酰肌醇 3-激酶/V-AKT 小鼠胸腺瘤病毒同源癌基因(PI3K-Akt)信號通路及其下游的 p53 信號通路,下調的 DEGs 主要參與的生物學通路為甲狀腺激素的合成、酪氨酸代謝、礦物吸收等(表 1)。

2.3 PPI 網絡構建和分析結果
構建 DEGs 的 PPI 網絡(圖 1b),使用 Cytoscape 獲得了最重要的子模塊(圖 1c)并篩選出了 10 個關鍵基因,即纖維連接蛋白 1(FN1)、細胞周期蛋白 D1(CCND1)、金屬肽酶抑制劑 1(TIMP1)、細胞間黏附分子 1(ICAM1)、載脂蛋白E (APOE)、MET(原癌基因 MET,酪氨酸激酶受體)、RUNX 家族轉錄因子 2(RUNX2)、角蛋白 19(KRT19)、KIT(原癌基因 KIT,酪氨酸蛋白激酶)和絲氨酸蛋白酶抑制蛋白家族 A 成員 1(SERPINA1),并對 DEGs 進行了基因富集的 GO 條目的分析以及可視化(圖 1d)。
2.4 關鍵基因相互作用網絡及功能分析結果
利用 STRING 在線數據庫繪制出 10 個關鍵基因及其共表達基因相關的基因互作網絡圖(圖 1e)。隨后通過 R 分析這 10 個關鍵基因與 RFS 的關系(圖 2a-2j),然后再使用 Benjaminiand-Hochberg 法對得到的假設檢驗 P 值做多重檢驗校正,可得 APOE(FDR=0.047 5)以及 KIT(FDR=0.042 0)基因表達的改變對 PTC 患者的 RFS 有一定的影響,具有統計學意義。同時使用 UCSC 癌癥基因組學瀏覽器(

a–j:分別表示 10 個關鍵基因表達水平與 RFS 的關系,
3 討論
本研究一共篩選出 339 個 PTC 和正常甲狀腺組織差異表達基因,包括 189 個上調基因和 150 個下調的 PTC 組織和非腫瘤組織之間的基因。GO 分析結果表明,上調的 DEGs 的生物學過程的改變明顯富集在細胞外基質降解、血管生成、MAPK 信號通路相關酶的活性和細胞間及細胞對胞外成分的反應。而下調的 DEGs 主要參與的生物學過程在甲狀腺激素的生物合成、RAS 信號通路的限制酶的活性、離子穩態的調節及細胞轉錄的調控。KEGG 途徑分析結果表明,上調的 DEGs 主要涉及的生物學通路為補體和凝血級聯反應過程、涉及細胞對胞外成分的反應的 ECM 受體相互作用、PI3K-Akt 信號通路及其下游的 p53 信號通路,下調的 DEGs 主要參與的生物學通路為甲狀腺激素的合成、酪氨酸代謝、礦物吸收等。而細胞外基質成分的降解通過激活不同的細胞信號通路,加快了腫瘤細胞的轉化和轉移過程[6]。其中細胞間及細胞與細胞外基質的相互作用可能涉及整合素結合、ECM 受體相互作用、細胞黏附等生物學途徑及 Notch 信號通路。此外,PTC 的發生發展可能與雌激素異常相關。分化良好的 TC,女性患者明顯多于男性患者。實驗證實,雌激素受體(ER)確實存在于 TC 組織中[7]。在細胞免疫調節、增殖、分化等過程中,白細胞介素(Interleukin,IL)發揮了重要作用,這與 PTC 的發生發展密切相關[8-9]。另外,本研究發現機體炎癥反應中的補體激活也可能參與到了癌癥的發生發展中。
PTC 的分子遺傳學研究目前主要集中在與腫瘤發生發展密切相關的信號通路上。信號通路是指分子信號介導胞外與細胞相互作用,引發細胞內一系列酶促級聯反應的通路。目前,絲裂原激活的蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路與磷脂酰肌醇 3-激酶/V-AKT、PI3K-Akt 信號通路已被證明與 PTC 發生發展密切相關[10]。MAPK 信號通路主要涉及 BRAF 基因、RAS 基因、ALK 基因、MEK 基因、ERK 基因等。當細胞外的刺激信號結合相應的細胞表面受體時,可激活受體細胞內部分蛋白激酶發揮功能,進而激活 RAS 基因,隨之激活 BREF 基因,繼續活化下游的 MEK 基因和 ERK 基因[11]。這與本研究差異基因 GO 分析出的 ERK1 和 ERK2 級聯調節、RPTK-Ras 信號通路等相一致。另外,ALK 可能通過引起 BRAF 激酶結構域異常表達影響該通路。在 PI3K-Akt 信號通路中,Akt 有多種方式磷酸化激活下游靶蛋白。一方面可活化 IκB 激酶,該激酶能夠降解核因子 NF-κB 的抑制劑 IκB,有證據表明核因子 NF-κB 通路也與甲狀腺癌的發生發展密切相關。另一方面,AKT 可通過抑制蛋白水解酶 Caspase-9 的激活阻止凋亡級聯反應發生。此外,腫瘤抑制因子 p53 為一介導內源性凋亡信號通路的轉錄因子。AKT 可磷酸化 p53 的結合蛋白 MDM2,進而使其轉位到細胞核中,結合 p53,促進其降解,影響細胞存活。此外對于 PTC,果蠅 WNT 同源基因/β-連鎖蛋白(Wnt/β-catenin)通路、轉化生長因子 β(TGF-β)通路以及 Notch 信號通路等也有重要意義。
構建 PPI 網絡圖后篩選出 10 個基因,即 FN1、CCND1、TIMP1、ICAM1、APOE、MET、RUNX2、KRT19、KIT 和 SERPINA1。
FN1 與腫瘤的發生發展密切相關,但在腫瘤中的功能卻存在爭議。一方面,FN1 可通過結合整合素,以 FAK、RAS 等途徑促進 MMP2/MMP9 的表達,從而促進卵巢癌和乳腺癌的生長、侵襲和轉移[12-13]。相關研究[14]表明,人表皮生長因子受體 2(HER2)可以通過 MEK 及 ERK 通路誘導 FN1 的表達,增加乳腺癌的遷移和侵襲能力。該途徑與 PTC 發生發展密切相關,提示 FN1 可能作為 PTC 靶向治療的新靶點。另一方面,FN1 又作為一個抑癌基因的角色出現在胃癌和結直腸癌腫瘤組織中。
CCND1 是細胞周期蛋白的重要成員之一,既往實驗表明其與 PTC 的惡性細胞增殖密切相關,與 PTC 淋巴結轉移無明顯關聯性[15],但也有研究[16]發現,CCND1 的陽性表達等因素是 PTC 出現淋巴結轉移和預后較差的危險因子,有待進一步研究。
TIMP1,相關研究[17]表明,TIMP1 作為關鍵靶基因,參與 MMPs 的轉錄后調控。主要通過與 MMPs 蛋白結合,降低其表達能力,這對 PTC 細胞遷移和侵襲的能力起到重要作用。
ICAM1,實驗[18]表明,一方面 ICAM-1 的上調與腫瘤的侵襲性特征如 BRAFV600E突變、ETE 和淋巴結轉移相關,其表達隨著腫瘤惡性程度的增高而增強,這提示 ICAM-1 在 PTC 的進展中起作用,且可作為判定腫瘤侵襲的指標之一。另一方面,相關實驗[19]表明, ICAM-1 僅在 PTC 中高表達,在甲狀腺濾泡狀癌、濾泡狀腺瘤和腺瘤樣甲狀腺腫中無表達,這有助于乳頭狀癌和濾泡狀癌兩種甲狀腺惡性腫瘤的鑒別診斷。
MET,Ramirez 等[20]用免疫組化方法證實分化型甲狀腺癌 C-MET 蛋白表達水平明顯高于甲狀腺良性腫瘤及正常組織。此外相關研究[21]表明,C-MET 蛋白表達強度與 PTC 轉移風險有關,體現在 C-MET 蛋白強表達組多合并有頸部淋巴結轉移,且癌灶突破包膜和周圍組織侵犯比例高。這些證據提示 MET 基因為臨床預后提供了一個良好的參考標準。
RUNX2,龔婷等[22]研究發現,RUNX2 在 PTC 中的表達水平的高低與腫瘤大小密切相關,在較大的癌灶中表達較高。RUNX2 可能與 PTC 內鈣化灶的產生及癌的發生發展有關,在其他的惡性腫瘤(如乳腺癌、前列腺癌、骨肉瘤)也有相關研究。此外,有研究[23]表明 RUNX2 是 miR-218 的直接靶標,可通過抑制其表達,抑制體內腫瘤生長,阻斷 PTEN-PI3K-Akt 途徑。
KRT19,在多種腫瘤發生發展中起重要作用,但在 PTC 中的作用尚不清楚。Wang 等[24]研究表明,KRT19 的表達僅在含有 B-Raf 原癌基因、絲氨酸/蘇氨酸激酶(BRAF)V600E 突變和 BRAFV600E過表達的腫瘤中增加。進而推測 BRAFV600E誘導的 KRT19 表達可能通過促進上皮間質轉化(EMT)促進 PTC 的轉移。
KIT 作為細胞因子 KITLG/SCF 的細胞表面受體,可激活多種信號通路,對調節細胞存活和增殖、細胞遷移等起重要作用。相關研究[25]表明,以該基因為靶點通過尿微生物可用于診斷乳腺癌,這意味著該基因可能作為新的 PTC 治療靶點。
SERPINA1,相關文獻[26]表明該基因可作為篩選 PTC 的靶點,準確區分 PTC 和良性結節。
APOE(載脂蛋白 E)是血漿脂蛋白的核心成分,參與其產生、轉化和清除,并在腫瘤微環境中誘導炎癥免疫反應。相關研究[27]表明其可作為評估非小細胞肺癌(NSCLC)淋巴結轉移的有效指標。此外,研究[28]發現在前列腺增生與前列腺癌之間,載脂蛋白E差異顯著。這意味著其可能是一種潛在的某些癌癥的生物標記物。
綜上,本研究旨在尋找 PTC 新的臨床病理特征判斷依據以及預后評價和靶向治療的新分子靶點,共篩選出 339 個 DEGs 及 10 個關鍵基因。但仍需要進一步的研究來具體闡明這些基因在 PTC 發生發展過程中的生物作用機制。
重要聲明
利益沖突聲明:作者聲明,該研究工作沒有利益沖突。
作者貢獻聲明:奧偉參與數據整理、分析、方法論、驗證及撰寫初稿;殷德濤參與概念化、監督和寫作審查和編輯。