引用本文: 燕豪, 解杰, 盧秀波, 樊玉霞. RNA結合蛋白ZFP36可能是甲狀腺乳頭狀癌無進展生存期的重要預測靶標. 中國普外基礎與臨床雜志, 2022, 29(9): 1195-1200. doi: 10.7507/1007-9424.202112038 復制
盡管甲狀腺乳頭狀癌 (papillary thyroid carcinoma,PTC)患者大部分預后良好,但仍有約30%的PTC患者在初次治療后5 年內出現疾病進展或死亡,因此盡可能改善PTC患者的無進展生存(progression-free survival,PFS)情況、避免其復發轉移一直是對PTC關注的焦點[1-3]。如果能對PTC患者預后進行較為準確的預測,將有助于對患者進行危險分層,高復發風險患者可以接受更大收益的治療手段,還可以讓復發風險低的患者避免過度治療。基因標志物可以通過標準化的檢測手段進行量化,以預測患者預后和復發風險,若能找到PTC患者疾病進展或復發的特異性基因標志物對PTC患者進行危險分層,將有助于對PTC患者采取個性化的治療方案,可能會降低患者疾病進展的風險。RNA結合蛋白(RNA binding proteins,RBPs)是一種可與多種RNA相互作用的蛋白質,在人類多種腫瘤中被證明與預后相關[4-5],并且有研究[6]報道RBPs基因預后模型可以預測甲狀腺癌患者的總體生存狀態。然而甲狀腺癌患者容易出現早期淋巴結轉移或初次手術后復發[7]。因此本研究以PTC患者死亡或疾病進展為觀察終點,研究PTC患者中差異表達的RBPs基因與PFS的關系,旨在尋找一個穩定的預后標志物并構建一個較穩健的PFS預后預測模型來為臨床決策的制定提供一定的幫助。
1 資料與方法
1.1 資料來源
1.1.1 數據庫資料
從UCSC Xena數據庫(
1.1.2 臨床病例資料
回顧性收集2020年10月至2021年1月期間在鄭州大學第一附屬醫院甲狀腺外科行甲狀腺手術的PTC患者的癌組織及其配對癌旁(距離癌組織以遠2.0 cm處)甲狀腺組織(簡稱“癌旁組織” )標本,所有患者均經兩位病理科醫師診斷為PTC。排除標準:① 腫瘤直徑 <1.0 cm;② 合并其他部位的惡性腫瘤。所有患者的診療方案均遵循2015年NCCN甲狀腺癌診療指南,患者均已簽署書面知情同意書。
1.2 差異表達RBPs基因獲取
RBPs基因集獲取于Gerstberger等[10]的人類RBPs普查研究。對從TCGA-THCA數據集中納入本研究的PTC和正常甲狀腺組織(簡稱“正常組織” )樣本的RNA測序數據使用R軟件包“limma”進行差異表達分析[11],差異表達RBPs基因的識別標準為校正后的差異倍數(| log2差異倍數 |)>1和P<0.05。
1.3 RBPs基因預后標志物的篩選及驗證
1.3.1 基因篩選
基于PFS情況和PTC中差異表達RBPs基因表達水平進行Cox單因素和多因素分析,以篩選具有預后預測價值的標志物;隨后使用R軟件包“survminer”對篩選出的具有預后預測價值的標志物進行Kaplan-Meier(K-M)生存分析,并使用其中的surv_utpoint函數確定其基因表達水平的最佳截斷值;再使用R軟件包“survivalROC”繪制時間依賴受試者工作特征(receiver operating characteristics,ROC)[12] 曲線并計算ROC曲線下面積(area under ROC curve, AUC)值,以評估RBPs基因預后標志物的臨床預測價值。
1.3.2 RBPs基因預后標志物的驗證
除了檢測RBPs基因預后標志物在TCGA-THCA數據集中PTC患者的癌組織及正常組織中的基因表達情況外,本研究另選取了基因表達綜合(gene expression omnibus,GEO)數據庫(
1.4 預后列線圖的建立與評估
首先使用R軟件對篩選出的預后標志物基因表達水平與PTC患者預后的關系進行分析,同時采用Cox單因素分析和多因素逐步回歸分析以確立與預后相關的影響因素;然后將篩選出具有PFS預測價值的RBPs基因預后標志物結合與PTC患者PFS有關的臨床病理特征參數建立具有PFS預測價值的列線圖預測模型,通過內部和外部1 000次自舉驗證[13]。使用R軟件包“survivalROC”繪制時間依賴ROC曲線并計算ROC曲線的AUC值,以評估列線圖的臨床預測價值。使用R包“rms”繪制列線圖3年PFS概率校準曲線。檢驗水準α=0.05。
2 結果
2.1 本研究納入患者的基本情況
2.1.1 數據庫中的病例資料
本研究從TCGA-THCA數據集中共納入PTC患者424例,其中男119例、女305例,年齡 <55歲282例、≥55歲142例,有甲狀腺腺體外侵犯144例,M0+Mx 418例、M1期6例,N0期211例、N1期213例,T1~2期253例、T3~4期171例,處于PFS狀態患者383例、處于疾病進展狀態患者41例,中位(上、下四分位數)PFS為2.53(1.39,3.96)個月。
2.1.2 臨床病例資料
共收集到2020年10月至2021年1月期間鄭州大學第一附屬醫院經手術治療的PTC患者30例,其中女22例,男8例;中位年齡43歲。
2.2 差異表達RBPs基因獲取結果
本研究共獲取了1 542個RBPs基因[10],其中有94個RBPs基因在PTC mRNA測序基因集中未見表達,因此有1 448個RBPs基因納入差異分析,最終識別出在PTC中有7個下調的RBPs基因(KHDRBS2、PPARGC1A、ZFP36L2、SMAD9、ARHGEF28、TDRD9、ZFP36)和3個上調的RBPs基因(ZMAT3、MVP、IGF2BP2),見圖1a。

2.3 RBPs基因預后標志物篩選結果
將獲得的10個差異表達RBPs基因進行Cox單因素和多因素分析,最終篩選出ZFP36基因與PFS有關(P=0.033),結果見表1。根據ZFP36基因表達水平的最佳截斷值(5.17)將424例PTC患者分為ZFP36高表達(≥5.17)和低表達(<5.17),K-M生存分析結果顯示,ZFP36低表達患者的預后情況差于ZFP36高表達患者(P<0.000 1),見圖1b。通過時間依賴 ROC分析ZFP36基因預測1、3、5年PFS率的AUC值分別為0.76 [95%CI(0.64,0.88)]、0.73 [95%CI(0.65,0.81)] 及0.72 [95%CI(0.64,0.79)]。

2.4 RBPs基因預后標志物的驗證
檢測經篩選出與PFS有關的ZFP36基因在TCGA-THCA數據集中的結果發現,其在424例PTC組織中的表達水平低于其在58例正常組織中的表達水平(t=5.358,P<0.001),見圖1c;在引入的外部GEO數據集GSE29265中的20例PTC患者的癌組織中的基因表達水平低于20例癌旁組織(t=2.654,P=0.016),見圖1d,此與TCGA-THCA數據集中的表達情況一致;再通過對鄭州大學第一附屬醫院收集的30例PTC患者的癌組織及其癌旁組織進行Western blot檢測的ZFP36蛋白表達情況與前面2個數據集中的基因表達情況基本一致,見圖1e。同時本研究對ZFP36基因在TCGA-THCA數據集中PTC患者不同臨床病理特征患者的表達情況進行了分析,ZFP36基因在T3~4期、有腺體外侵犯及年齡 ≥55歲的患者中的表達水平低于T1~2期、無腺體外侵犯及年齡 <55歲者(t=1.977、P=0.049;t=2.651、P=0.009;t=2.671、P=0.008),見圖1f~1h。
2.5 RBPs基因預后標志物ZFP36基因表達水平與預后的關系及列線圖構建結果
使用R軟件對預后標志物ZFP36基因表達水平與424例不同臨床病理特征PTC患者PFS的關系進行分析的結果(圖2)顯示,ZFP36基因在總體患者中為保護因素(OR=0.68,P=0.004),在年輕(<55歲)、無腺體外侵犯、無遠處轉移、無淋巴結轉移、T3~4期及男性患者中均為PFS的保護因素(OR<1,P<0.05)。進一步采用Cox單因素和多因素分析篩選與PTC患者PFS相關的影響因素,結果見表2。從表2可見,M分期、T分期和ZFP36基因表達水平與PFS有關(P<0.05),將這些因素構建可預測PTC患者1、3和5年PFS概率的列線圖(圖3a),通過時間依賴ROC曲線(圖3b)分析列線圖預測PTC患者1、3、5年PFS率的AUC值分別為0.80 [95%CI(0.69,0.91)]、0.72 [95%CI(0.62,0.81)]、0.64 [95%CI(0.50,0.77)],列線圖的C指數為0.724 [95%CI(0.685,0.763)]。3年PFS概率的校準曲線與理想對角線非常接近,見圖3c。



3 討論
盡管PTC患者相較于其他癌具有更高的生存率,然而多數患者在接受首次治療后仍有較大復發風險,復發性PTC患者存在額外的手術創傷且發生喉返神經損傷等手術并發癥的風險較高[1, 14]。基因標志物可以通過標準化的檢測手段進行量化,其隨著腫瘤的生物學進展而變化,并且可以隨著患者病情的變化動態反映預后,預測患者預后和復發風險可能更準確、更方便。找到PTC患者疾病進展或復發的特異性基因靶標可以對PTC患者進行危險分層,有助于對PTC患者采取個性化的治療方案;另一方面,針對特異性靶標進行個性化治療可能會降低患者疾病進展的風險。
RBPs可在細胞中穩定表達并介導多種RNA之間的相互作用和核糖核蛋白的形成,以控制基因表達的轉錄后調控[15-16]。有研究[17-19]對PTC的基因表達譜如微小RNAs、長鏈非編碼RNA、免疫相關基因等進行了研究。然而與PTC患者PFS情況相關的RBPs基因標志物少見。在本研究中,首先利用TCGA的RNA測序數據檢測了PTC癌組織和正常甲狀腺組織樣本之間差異表達的RBPs,進而通過Cox單因素和多因素分析最終篩選出了PTC中1個與預后相關的RBPs基因預后標志物ZFP36。
ZFP36(又稱Tristetraprolin)是研究最深入的轉錄因子之一,通過結合 3′ -非翻譯區的富含腺苷尿苷的元件并招募去腺苷酸化和降解因子來破壞目標mRNA以改變細胞對脂質過氧化、氧化應激、細胞凋亡和免疫刺激的反應[20-21]。近年來,有研究[22-24]表明,ZFP36在腫瘤中有著抑制腫瘤發生并影響腫瘤惡性表型的作用,然而目前ZFP36在甲狀腺癌中的作用報道較少。
本研究基于生物信息學發掘出RBPs ZFP36,其在PTC癌組織中的基因表達水平相較于正常甲狀腺組織較低,提示ZFP36可能是PTC的抑癌基因,通過GEO數據庫中數據的基因表達分析和鄭州大學第一附屬醫院臨床樣本的Western blot檢測的蛋白表達結果驗證了這一結果;通過Cox回歸分析TCGA-THCA數據集中PTC患者的資料發現,ZFP36基因表達水平與PTC患者的PFS情況有關,ZFP36為其保護因素,ZFP36高表達者的PFS情況優于ZFP36低表達者,并且還發現,ZFP36表達水平與T分期、腺體外侵犯情況和年齡有關。這些結果提示,ZFP36可能對PTC患者PFS情況具有重要預測價值,其中的具體機制需要后續進一步去研究。本研究還將ZFP36結合臨床病理特征構建了用以預測PTC患者PFS情況的列線圖模型,其可以較為準確地預測患者的PFS情況,該模型可能為PTC患者的臨床個性化診斷和治療提供一定的幫助。然而也需注意本研究的不足,ZFP36仍需多中心大樣本量的循證醫學證據支持;其次本研究是基于數據庫隊列分析,缺少外部隊列進一步驗證。
重要聲明
利益沖突聲明:所有作者均無利益沖突。
作者貢獻聲明:樊玉霞和盧秀波指導完成本研究;燕豪撰寫文章及修改;解杰負責數據的分析及整理。
倫理聲明:本研究通過了鄭州大學第一附屬醫院科研項目倫理審查委員會的審批(批文編號:修正案2020-153)。
盡管甲狀腺乳頭狀癌 (papillary thyroid carcinoma,PTC)患者大部分預后良好,但仍有約30%的PTC患者在初次治療后5 年內出現疾病進展或死亡,因此盡可能改善PTC患者的無進展生存(progression-free survival,PFS)情況、避免其復發轉移一直是對PTC關注的焦點[1-3]。如果能對PTC患者預后進行較為準確的預測,將有助于對患者進行危險分層,高復發風險患者可以接受更大收益的治療手段,還可以讓復發風險低的患者避免過度治療。基因標志物可以通過標準化的檢測手段進行量化,以預測患者預后和復發風險,若能找到PTC患者疾病進展或復發的特異性基因標志物對PTC患者進行危險分層,將有助于對PTC患者采取個性化的治療方案,可能會降低患者疾病進展的風險。RNA結合蛋白(RNA binding proteins,RBPs)是一種可與多種RNA相互作用的蛋白質,在人類多種腫瘤中被證明與預后相關[4-5],并且有研究[6]報道RBPs基因預后模型可以預測甲狀腺癌患者的總體生存狀態。然而甲狀腺癌患者容易出現早期淋巴結轉移或初次手術后復發[7]。因此本研究以PTC患者死亡或疾病進展為觀察終點,研究PTC患者中差異表達的RBPs基因與PFS的關系,旨在尋找一個穩定的預后標志物并構建一個較穩健的PFS預后預測模型來為臨床決策的制定提供一定的幫助。
1 資料與方法
1.1 資料來源
1.1.1 數據庫資料
從UCSC Xena數據庫(
1.1.2 臨床病例資料
回顧性收集2020年10月至2021年1月期間在鄭州大學第一附屬醫院甲狀腺外科行甲狀腺手術的PTC患者的癌組織及其配對癌旁(距離癌組織以遠2.0 cm處)甲狀腺組織(簡稱“癌旁組織” )標本,所有患者均經兩位病理科醫師診斷為PTC。排除標準:① 腫瘤直徑 <1.0 cm;② 合并其他部位的惡性腫瘤。所有患者的診療方案均遵循2015年NCCN甲狀腺癌診療指南,患者均已簽署書面知情同意書。
1.2 差異表達RBPs基因獲取
RBPs基因集獲取于Gerstberger等[10]的人類RBPs普查研究。對從TCGA-THCA數據集中納入本研究的PTC和正常甲狀腺組織(簡稱“正常組織” )樣本的RNA測序數據使用R軟件包“limma”進行差異表達分析[11],差異表達RBPs基因的識別標準為校正后的差異倍數(| log2差異倍數 |)>1和P<0.05。
1.3 RBPs基因預后標志物的篩選及驗證
1.3.1 基因篩選
基于PFS情況和PTC中差異表達RBPs基因表達水平進行Cox單因素和多因素分析,以篩選具有預后預測價值的標志物;隨后使用R軟件包“survminer”對篩選出的具有預后預測價值的標志物進行Kaplan-Meier(K-M)生存分析,并使用其中的surv_utpoint函數確定其基因表達水平的最佳截斷值;再使用R軟件包“survivalROC”繪制時間依賴受試者工作特征(receiver operating characteristics,ROC)[12] 曲線并計算ROC曲線下面積(area under ROC curve, AUC)值,以評估RBPs基因預后標志物的臨床預測價值。
1.3.2 RBPs基因預后標志物的驗證
除了檢測RBPs基因預后標志物在TCGA-THCA數據集中PTC患者的癌組織及正常組織中的基因表達情況外,本研究另選取了基因表達綜合(gene expression omnibus,GEO)數據庫(
1.4 預后列線圖的建立與評估
首先使用R軟件對篩選出的預后標志物基因表達水平與PTC患者預后的關系進行分析,同時采用Cox單因素分析和多因素逐步回歸分析以確立與預后相關的影響因素;然后將篩選出具有PFS預測價值的RBPs基因預后標志物結合與PTC患者PFS有關的臨床病理特征參數建立具有PFS預測價值的列線圖預測模型,通過內部和外部1 000次自舉驗證[13]。使用R軟件包“survivalROC”繪制時間依賴ROC曲線并計算ROC曲線的AUC值,以評估列線圖的臨床預測價值。使用R包“rms”繪制列線圖3年PFS概率校準曲線。檢驗水準α=0.05。
2 結果
2.1 本研究納入患者的基本情況
2.1.1 數據庫中的病例資料
本研究從TCGA-THCA數據集中共納入PTC患者424例,其中男119例、女305例,年齡 <55歲282例、≥55歲142例,有甲狀腺腺體外侵犯144例,M0+Mx 418例、M1期6例,N0期211例、N1期213例,T1~2期253例、T3~4期171例,處于PFS狀態患者383例、處于疾病進展狀態患者41例,中位(上、下四分位數)PFS為2.53(1.39,3.96)個月。
2.1.2 臨床病例資料
共收集到2020年10月至2021年1月期間鄭州大學第一附屬醫院經手術治療的PTC患者30例,其中女22例,男8例;中位年齡43歲。
2.2 差異表達RBPs基因獲取結果
本研究共獲取了1 542個RBPs基因[10],其中有94個RBPs基因在PTC mRNA測序基因集中未見表達,因此有1 448個RBPs基因納入差異分析,最終識別出在PTC中有7個下調的RBPs基因(KHDRBS2、PPARGC1A、ZFP36L2、SMAD9、ARHGEF28、TDRD9、ZFP36)和3個上調的RBPs基因(ZMAT3、MVP、IGF2BP2),見圖1a。

2.3 RBPs基因預后標志物篩選結果
將獲得的10個差異表達RBPs基因進行Cox單因素和多因素分析,最終篩選出ZFP36基因與PFS有關(P=0.033),結果見表1。根據ZFP36基因表達水平的最佳截斷值(5.17)將424例PTC患者分為ZFP36高表達(≥5.17)和低表達(<5.17),K-M生存分析結果顯示,ZFP36低表達患者的預后情況差于ZFP36高表達患者(P<0.000 1),見圖1b。通過時間依賴 ROC分析ZFP36基因預測1、3、5年PFS率的AUC值分別為0.76 [95%CI(0.64,0.88)]、0.73 [95%CI(0.65,0.81)] 及0.72 [95%CI(0.64,0.79)]。

2.4 RBPs基因預后標志物的驗證
檢測經篩選出與PFS有關的ZFP36基因在TCGA-THCA數據集中的結果發現,其在424例PTC組織中的表達水平低于其在58例正常組織中的表達水平(t=5.358,P<0.001),見圖1c;在引入的外部GEO數據集GSE29265中的20例PTC患者的癌組織中的基因表達水平低于20例癌旁組織(t=2.654,P=0.016),見圖1d,此與TCGA-THCA數據集中的表達情況一致;再通過對鄭州大學第一附屬醫院收集的30例PTC患者的癌組織及其癌旁組織進行Western blot檢測的ZFP36蛋白表達情況與前面2個數據集中的基因表達情況基本一致,見圖1e。同時本研究對ZFP36基因在TCGA-THCA數據集中PTC患者不同臨床病理特征患者的表達情況進行了分析,ZFP36基因在T3~4期、有腺體外侵犯及年齡 ≥55歲的患者中的表達水平低于T1~2期、無腺體外侵犯及年齡 <55歲者(t=1.977、P=0.049;t=2.651、P=0.009;t=2.671、P=0.008),見圖1f~1h。
2.5 RBPs基因預后標志物ZFP36基因表達水平與預后的關系及列線圖構建結果
使用R軟件對預后標志物ZFP36基因表達水平與424例不同臨床病理特征PTC患者PFS的關系進行分析的結果(圖2)顯示,ZFP36基因在總體患者中為保護因素(OR=0.68,P=0.004),在年輕(<55歲)、無腺體外侵犯、無遠處轉移、無淋巴結轉移、T3~4期及男性患者中均為PFS的保護因素(OR<1,P<0.05)。進一步采用Cox單因素和多因素分析篩選與PTC患者PFS相關的影響因素,結果見表2。從表2可見,M分期、T分期和ZFP36基因表達水平與PFS有關(P<0.05),將這些因素構建可預測PTC患者1、3和5年PFS概率的列線圖(圖3a),通過時間依賴ROC曲線(圖3b)分析列線圖預測PTC患者1、3、5年PFS率的AUC值分別為0.80 [95%CI(0.69,0.91)]、0.72 [95%CI(0.62,0.81)]、0.64 [95%CI(0.50,0.77)],列線圖的C指數為0.724 [95%CI(0.685,0.763)]。3年PFS概率的校準曲線與理想對角線非常接近,見圖3c。



3 討論
盡管PTC患者相較于其他癌具有更高的生存率,然而多數患者在接受首次治療后仍有較大復發風險,復發性PTC患者存在額外的手術創傷且發生喉返神經損傷等手術并發癥的風險較高[1, 14]。基因標志物可以通過標準化的檢測手段進行量化,其隨著腫瘤的生物學進展而變化,并且可以隨著患者病情的變化動態反映預后,預測患者預后和復發風險可能更準確、更方便。找到PTC患者疾病進展或復發的特異性基因靶標可以對PTC患者進行危險分層,有助于對PTC患者采取個性化的治療方案;另一方面,針對特異性靶標進行個性化治療可能會降低患者疾病進展的風險。
RBPs可在細胞中穩定表達并介導多種RNA之間的相互作用和核糖核蛋白的形成,以控制基因表達的轉錄后調控[15-16]。有研究[17-19]對PTC的基因表達譜如微小RNAs、長鏈非編碼RNA、免疫相關基因等進行了研究。然而與PTC患者PFS情況相關的RBPs基因標志物少見。在本研究中,首先利用TCGA的RNA測序數據檢測了PTC癌組織和正常甲狀腺組織樣本之間差異表達的RBPs,進而通過Cox單因素和多因素分析最終篩選出了PTC中1個與預后相關的RBPs基因預后標志物ZFP36。
ZFP36(又稱Tristetraprolin)是研究最深入的轉錄因子之一,通過結合 3′ -非翻譯區的富含腺苷尿苷的元件并招募去腺苷酸化和降解因子來破壞目標mRNA以改變細胞對脂質過氧化、氧化應激、細胞凋亡和免疫刺激的反應[20-21]。近年來,有研究[22-24]表明,ZFP36在腫瘤中有著抑制腫瘤發生并影響腫瘤惡性表型的作用,然而目前ZFP36在甲狀腺癌中的作用報道較少。
本研究基于生物信息學發掘出RBPs ZFP36,其在PTC癌組織中的基因表達水平相較于正常甲狀腺組織較低,提示ZFP36可能是PTC的抑癌基因,通過GEO數據庫中數據的基因表達分析和鄭州大學第一附屬醫院臨床樣本的Western blot檢測的蛋白表達結果驗證了這一結果;通過Cox回歸分析TCGA-THCA數據集中PTC患者的資料發現,ZFP36基因表達水平與PTC患者的PFS情況有關,ZFP36為其保護因素,ZFP36高表達者的PFS情況優于ZFP36低表達者,并且還發現,ZFP36表達水平與T分期、腺體外侵犯情況和年齡有關。這些結果提示,ZFP36可能對PTC患者PFS情況具有重要預測價值,其中的具體機制需要后續進一步去研究。本研究還將ZFP36結合臨床病理特征構建了用以預測PTC患者PFS情況的列線圖模型,其可以較為準確地預測患者的PFS情況,該模型可能為PTC患者的臨床個性化診斷和治療提供一定的幫助。然而也需注意本研究的不足,ZFP36仍需多中心大樣本量的循證醫學證據支持;其次本研究是基于數據庫隊列分析,缺少外部隊列進一步驗證。
重要聲明
利益沖突聲明:所有作者均無利益沖突。
作者貢獻聲明:樊玉霞和盧秀波指導完成本研究;燕豪撰寫文章及修改;解杰負責數據的分析及整理。
倫理聲明:本研究通過了鄭州大學第一附屬醫院科研項目倫理審查委員會的審批(批文編號:修正案2020-153)。