自噬是一種程序性細胞降解過程,與包括惡性腫瘤在內的多種生理和病理過程有關。自噬的異常誘導在肝細胞癌的發展中起著關鍵作用,因此我們基于自噬相關基因進行了肝細胞癌患者預后預測模型的構建。從癌癥基因組圖譜數據庫中檢索到204個差異表達的自噬相關基因以及377例已登記的肝細胞癌患者的基本信息和臨床特征。采用Cox風險回歸分析確定與生存相關的自噬相關基因,并在此基礎上構建預后相關預測模型。在肝細胞癌患者中總共鑒定出64個差異表達的自噬相關基因。經單因素和多因素Cox回歸分析后確定5個與肝細胞癌患者預后相關的危險因子,包括TMEM74、BIRC5、SQSTM1、CAPN10和HSPB8。將年齡、性別、腫瘤分級和分期以及風險評分作為變量納入多因素Cox回歸分析,結果顯示風險評分是肝細胞癌患者的獨立預后危險因素(HR = 1.475,95% CI = 1.280~1.699,P < 0.001)。此外,預后風險模型的曲線下面積為0.739,表明該模型在預測肝細胞癌預后方面具有較高準確性。結果表明我們將肝細胞癌患者的分子特征和臨床參數相結合所建立的新的預后風險模型,可以有效地預測肝癌患者預后。
引用本文: 黃煒, 韓寧, 杜凌遙, 曹丹, 唐紅. 基于自噬相關基因的肝細胞癌患者預后預測模型的構建. 生物醫學工程學雜志, 2022, 39(1): 120-127. doi: 10.7507/1001-5515.202101090 復制
引言
肝細胞癌(hepatocellular carcinoma,HCC)是最常見的原發性肝癌,占所有病例的75%~85%,主要由肝炎病毒的慢性感染、糖脂代謝紊亂、攝入過量黃曲霉毒素污染的食物、酗酒、吸煙和肥胖等引起[1-2]。由于腫瘤的異質性和耐藥性,手術切除和肝移植是目前治療肝癌最有效的策略,但依舊會面臨癌癥復發的風險[3]。盡管最近一項研究顯示,阿替唑珠單抗和貝伐單抗聯合應用可以改善晚期肝癌患者的預后,但肝癌患者的總體預后仍不理想[4]。目前基因測序技術發展快速,大量研究表明TP53和CTNNB1等熱點基因的突變、細胞代謝途徑異常、自噬等都參與了HCC的發生發展[5]。
自噬是細胞的一種自我調節機制,主要由自噬相關基因(autophagy-related genes,ARGs)執行,是真核細胞將吞噬細胞蛋白和細胞器的自噬小體運送到溶酶體進行降解的過程,這一過程對維持細胞內環境的穩態發揮著至關重要的作用[6]。目前,研究認為ARGs異常表達廣泛參與了包括癌癥在內的多種疾病的發生和發展。部分研究認為在癌癥早期增強自噬有助于防止癌癥進展,與此同時,也有研究認為自噬調節劑可以為晚期癌癥患者帶來希望[6-9]。
最近的研究報道自噬在HCC的發病機制中起著至關重要的作用。事實上,與周圍的正常組織相比,HCC癌組織中的自噬程度更明顯。此外,癌細胞對周圍組織的侵襲也與其細胞內更高水平的自噬有關[10]。盡管有研究已經構建了幾個預測HCC預后的模型,但很少有研究考慮將ARGs用于預測HCC患者的臨床預后。由于HCC患者存在個體差異,所以需要構建不受其他臨床特征影響并且可以預測HCC患者預后相關的模型。因此,我們研究了癌癥基因組圖譜數據庫(The Cancer Genome Atlas,TCGA)中HCC患者ARGs表達情況與臨床結局的相關性,并且建立了臨床預后相關的預測模型,以期提高HCC患者的臨床預后。
1 方法
1.1 數據來源
HCC患者的RNA-Seq數據和臨床信息來自TCGA數據庫(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/using-tcga)。從匯總自噬相關人類基因信息的人類自噬數據庫(Human Autophagy Database,HADb,http://www.autophagy.lu/clustering/index.html)中提取ARGs。
1.2 富集分析差異表達的ARGs
用R軟件包Edge R對TCGA數據中的ARGs進行差異基因表達分析。與正常組織相比,只有當HCC患者癌組織中某一基因表達水平至少有2倍變化時,該基因才被認為是差異表達。利用基因本體數據庫(gene ontology,GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)對差異表達的ARGs進行基因功能富集分析。
1.3 基于ARGs的預后模型的構建
采用單變量Cox回歸分析,從TCGA-LIHC數據集中確定與HCC患者總生存(overall survival,OS)相關的差異表達ARGs,然后將確定的OS相關ARGs納入多變量Cox回歸分析,以確定HCC患者潛在的獨立預后ARGs。將各基因多因素Cox回歸系數及其表達量進行線性組合,從而建立風險評分模型。風險評分公式計算如下:風險評分 = (Expr1 × Coef1) + (Expr2 × Coef2) + + (Exprn × Coefn)[11]。
將獲得的預后ARGs用于構建風險評分模型,并且計算HCC患者的風險評分,確定所有患者評分的中位值,然后將HCC患者分為低風險組(低于中位值)和高風險組(高于中位值)。采用Kaplan-Meier(K-M)生存曲線對高風險組和低風險組進行分層分析,并采用log-rank檢驗分析有無統計學意義。采用受試者工作特征(receiver operating characteristic,ROC)曲線來檢驗風險模型在生存預測中的效率,ROC曲線下面積(area under the ROC curve,AUC)用于衡量模型的預測效率。
1.4 統計分析
數據管理、統計分析和繪圖主要基于R-4.0.2(https://www.r-project.org)。用對數秩檢驗確定Kaplan-Meier法生成的生存曲線之間的差異。P ≤0.05被認為有統計學意義。
2 結果
2.1 數據獲取和差異表達的ARGs
在TCGA數據庫中提取了377名原發性HCC患者的基因表達譜和臨床數據見表1。從HADb數據庫共獲得232個ARGs,與TCGA-LIHC數據進行比較,最終納入204個有效ARGs。隨后,通過基因表達的差異分析,共鑒定出64個ARGs發生顯著變化,包括60個上調基因和4個下調基因(見圖1a~b)。圖1c的箱式圖顯示了癌組織和正常組織差異ARGs的表達情況。


a~b. 肝癌組織與正常組織相比差異表達的64個自噬相關基因的熱圖和火山圖,其中火山圖中紅點代表顯著上調基因,綠點代表顯著下調基因,黑點代表無顯著差異的基因;c. 64個差異基因的箱式圖,紅色為癌組織樣本,綠色為正常組織樣本
Figure1. Differential expression profile of autophagy related genes between hepatocellular carcinoma and normal liver tissuea-b. the heat map and volcano map of 64 autophagy related genes differentially expressed in HCC tissues compared with normal tissues. In the volcano map, red dots represent significantly up-regulated genes, green dots represent significantly down-regulated genes, and black dots represent genes with no significant difference. c. the box diagram of 64 differential genes is shown. The red stands for cancer tissues and the green represents normal tissues
2.2 差異表達ARGs的功能富集
隨后我們對這64個差異基因進行功能富集分析,圖2展示了GO富集和KEGG信號通路分析的前30個結果。GO和KEGG分析發現,這些差異的ARGs主要參與了自噬、凋亡信號通路、IL-17信號通路、PI3K-Akt信號通路和p53信號通路等。

a~b. 通過GO分析顯示了差異ARGs參與的生物學過程和功能;c~d. 差異ARGs對癌細胞信號通路發揮潛在作用的KEGG分析
Figure2. Gene function enrichment analysis of differential ARGsa-b. the biological process and function of different ARGs through GO analysis; c-d. the KEGG analysis of the potential role of different ARGs in cancer cell signaling pathway
2.3 預后相關的ARGs的確定
為了分析ARGs在HCC進展中的作用,我們篩選了與預后顯著相關的ARGs。單因素Cox回歸分析發現14個與OS相關的ARGs且均為危險因素(如表2所示)。隨后,多因素Cox回歸分析發現5個與OS顯著相關的ARGs,分別是TMEM74、BIRC5、SQSTM1、CAPN10和HSPB8(如表3所示)。在此基礎上,我們構建了基于自噬基因相關的HCC預后風險模型,以更好地預測HCC患者的臨床預后。所構建的評分模型公式為:0.443 97 × EXPTMEM74 + 0.153 91 × EXPBIRC5 + 0.176 14 × EXPSQSTM1 + 0.752 93 × EXPCAPN10 +0.120 46 × EXPHSPB8(EXP代表不同的自噬基因的表達量)。圖3a~c分別顯示最終5個ARGs在TCGA數據集中的分布、不同組中患者的生存狀態和表達熱圖。隨后,通過繪制K-M生存曲線,分析高風險組和低風險組的不同生存時間,以確定該模型預測HCC患者臨床預后的能力,圖3d結果顯示高風險組HCC患者生存率明顯低于低風險組HCC患者。



a~b. 不同模型風險評分分組HCC患者生存結局的相關性,可以看到隨著風險評分增加,HCC患者的生存時間逐漸下降;c. 高風險組和低風險組患者差異ARGs的表達情況;d. K-M圖顯示,與低風險組HCC患者相比,高風險組患者的生存時間明顯縮短
Figure3. The correlation study between the prognostic risk model score and the survival rate of HCC patientsa-b. the correlation of the survival outcome of HCC patients in different risk score groups. It can be seen that the survival time of HCC patients gradually decreases as the risk score increases. c. different expressions of ARGs between high-risk group and low-risk group. d. K-M chart shows that compared with HCC patients in the low-risk group, the survival time of patients in the high-risk group is significantly shorter
2.4 基于ARGs的預后模型評分為HCC預后的獨立風險因素
在調整了年齡、性別、分化程度、分期、腫瘤大小、淋巴結轉移和遠處轉移等因素后,如圖4a所示的單因素分析(HR = 1.544,95% CI = 1.359~1.754,P < 0.001)和如圖4b所示的多因素分析(HR = 1.475,95% CI = 1.280~1.699,P < 0.001)均發現模型的風險評分是肝癌患者的獨立預后指標。5年生存率曲線的AUC值為0.739,明顯高于年齡(0.541)、性別(0.501)、腫瘤分化程度(0.480)、腫瘤分期(0.699)、腫瘤大小(0.700)、轉移狀況(0.509)和淋巴結轉移狀況(0.514)。這表明基于ARGs的預后模型在一定程度上能夠預測HCC患者的生存,見圖4c。

a~b. 單因素Cox回歸分析和多因素Cox回歸分析的森林圖;c. 基于差異ARGs的預后風險模型預測HCC患者OS的曲線下面積
Figure4. The prediction model based on differential ARGs shows good prediction abilitya-b. forest plots for univariate Cox regression analysis and multivariate Cox regression analysis; c. the area under the curve of the prognostic risk model based on differential ARGs for predicting OS in HCC patients
3 討論
盡管有大量研究報道自噬與HCC的發生發展、轉移和耐藥有關,但ARGs在HCC中的具體功能及其臨床意義尚不明晰。此外,某些針對ARGs開展的單基因研究雖能預測HCC患者的預后,但仍具有局限性。因此,從ARGs數據庫中篩選出多個差異基因構建HCC預后模型具有重要意義。本研究最終篩選出5個預后相關的ARGs,并且構建了一個可用于預測HCC患者預后的模型,這為HCC患者進行個體化治療提供了一個新的思路。
我們在這項研究中,分析了TCGA數據庫中HCC患者的高通量轉錄組數據,以確定潛在的預后相關ARGs。與正常組織相比,HCC患者癌組織中共有64個ARGs表達有顯著差異,其中60個基因表達上調,4個基因表達下調。然后對這些基因進行單因素Cox回歸分析,確定14個與HCC患者OS相關的ARGs。隨后通過多因素Cox回歸分析,最終確定了5個差異表達ARGs(TMEM74、BIRC5、SQSTM1、CAPN10和HSPB8),并用于構建基于加權風險評分的HCC預后模型。生存分析顯示,與風險評分較高組相比,低分組表現出更好的OS。利用多指標ROC曲線發現本研究構建的ARGs相關預后模型有較好的預測能力。
TMEM74即跨膜蛋白74,是一種溶酶體跨膜蛋白,主要誘導細胞自噬[12]。有研究表明TMEM74的TM結構域與凋亡誘導因子BIK的BH3結構域結合,并且抑制BIK誘導的細胞凋亡[13]。此外還有研究表明TMEM74能夠誘導自噬從而促進HepG2細胞的增殖[14]。研究人員表明,BIRC5在多種惡性腫瘤中有高表達,并且預示著這些患者的臨床預后不良,包括乳腺癌、肺腺癌、神經母細胞惡性腫瘤、胰腺癌和食管癌等[15-17]。Wang等[18]的研究結果與我們的一致,BIRC5在HCC組織中高表達,并且可以預測HCC患者的預后,提示BIRC5可能參與HCC的發生和發展。此外,有研究表明SQSTM1是包括HCC在內的多種癌癥的潛在癌基因[19]。P62是SQSTM1的表達產物,是一種多功能蛋白,作為接頭蛋白可以誘導自噬進而導致特定靶蛋白的降解[20]。已經有研究證明大量磷酸化的SQSTM1/p62會聚集在HCC患者的癌組織,而它的抑制劑可能會抑制細胞增殖[21-22]。CAPN10作為鈣蛋白酶家族的一員,是能被細胞內鈣離子激活的半胱氨酸蛋白酶,同時還是2型糖尿病的易感基因[23-24]。有研究表明它能將微管相關蛋白1家族的蛋白加工成重鏈和輕鏈,并調節其與微管和肌動蛋白絲的結合活性[25-26]。此外,研究發現它參與了多種癌癥的發生發展,包括食管癌、胰腺癌、結腸癌和喉癌等,但目前關于其在HCC發生發展中的作用尚不明確[27-29]。早在2015年就有研究發現熱休克蛋白家族基因表達的上調與HBV相關的早期HCC患者的預后不良有關[30-31]。隨后,又有研究發現HSPB8可以通過PI3K/AKT信號通路參與HCC的發生和轉移[32]。
本研究也具有一定的局限性。首先,該研究納入的數據是回顧性的,存在一定的偏倚;其次,該研究中建立的預后模型需要更多研究進行驗證;最后,模型納入的差異基因所發揮的具體功能仍需進一步探索。后續將在我院已收集的肝癌標本庫中對該預后模型做進一步驗證。與此同時,我們將會對模型得分高者和得分低者進行長期隨訪,來檢驗模型的準確性。
4 結論
總之,我們的研究證明了ARGs在HCC患者預后中的潛在作用,并且成功構建了相關預后模型,包括TMEM74、BIRC5、SQSTM1、CAPN10和HSPB8,該模型對于HCC患者的臨床結局具有良好的預測能力。盡管該模型所納入的基因在HCC中的作用機制還需要進一步研究,但我們的發現為探索ARGs作為HCC治療研發的潛在靶點提供了初步基礎。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:黃煒負責課題設計、采集數據、分析數據、統計分析、起草文章;韓寧、杜凌遙、曹丹負責課題設計、采集數據、分析數據;唐紅負責對文章的知識性內容作出批評性審閱。
引言
肝細胞癌(hepatocellular carcinoma,HCC)是最常見的原發性肝癌,占所有病例的75%~85%,主要由肝炎病毒的慢性感染、糖脂代謝紊亂、攝入過量黃曲霉毒素污染的食物、酗酒、吸煙和肥胖等引起[1-2]。由于腫瘤的異質性和耐藥性,手術切除和肝移植是目前治療肝癌最有效的策略,但依舊會面臨癌癥復發的風險[3]。盡管最近一項研究顯示,阿替唑珠單抗和貝伐單抗聯合應用可以改善晚期肝癌患者的預后,但肝癌患者的總體預后仍不理想[4]。目前基因測序技術發展快速,大量研究表明TP53和CTNNB1等熱點基因的突變、細胞代謝途徑異常、自噬等都參與了HCC的發生發展[5]。
自噬是細胞的一種自我調節機制,主要由自噬相關基因(autophagy-related genes,ARGs)執行,是真核細胞將吞噬細胞蛋白和細胞器的自噬小體運送到溶酶體進行降解的過程,這一過程對維持細胞內環境的穩態發揮著至關重要的作用[6]。目前,研究認為ARGs異常表達廣泛參與了包括癌癥在內的多種疾病的發生和發展。部分研究認為在癌癥早期增強自噬有助于防止癌癥進展,與此同時,也有研究認為自噬調節劑可以為晚期癌癥患者帶來希望[6-9]。
最近的研究報道自噬在HCC的發病機制中起著至關重要的作用。事實上,與周圍的正常組織相比,HCC癌組織中的自噬程度更明顯。此外,癌細胞對周圍組織的侵襲也與其細胞內更高水平的自噬有關[10]。盡管有研究已經構建了幾個預測HCC預后的模型,但很少有研究考慮將ARGs用于預測HCC患者的臨床預后。由于HCC患者存在個體差異,所以需要構建不受其他臨床特征影響并且可以預測HCC患者預后相關的模型。因此,我們研究了癌癥基因組圖譜數據庫(The Cancer Genome Atlas,TCGA)中HCC患者ARGs表達情況與臨床結局的相關性,并且建立了臨床預后相關的預測模型,以期提高HCC患者的臨床預后。
1 方法
1.1 數據來源
HCC患者的RNA-Seq數據和臨床信息來自TCGA數據庫(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/using-tcga)。從匯總自噬相關人類基因信息的人類自噬數據庫(Human Autophagy Database,HADb,http://www.autophagy.lu/clustering/index.html)中提取ARGs。
1.2 富集分析差異表達的ARGs
用R軟件包Edge R對TCGA數據中的ARGs進行差異基因表達分析。與正常組織相比,只有當HCC患者癌組織中某一基因表達水平至少有2倍變化時,該基因才被認為是差異表達。利用基因本體數據庫(gene ontology,GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)對差異表達的ARGs進行基因功能富集分析。
1.3 基于ARGs的預后模型的構建
采用單變量Cox回歸分析,從TCGA-LIHC數據集中確定與HCC患者總生存(overall survival,OS)相關的差異表達ARGs,然后將確定的OS相關ARGs納入多變量Cox回歸分析,以確定HCC患者潛在的獨立預后ARGs。將各基因多因素Cox回歸系數及其表達量進行線性組合,從而建立風險評分模型。風險評分公式計算如下:風險評分 = (Expr1 × Coef1) + (Expr2 × Coef2) + + (Exprn × Coefn)[11]。
將獲得的預后ARGs用于構建風險評分模型,并且計算HCC患者的風險評分,確定所有患者評分的中位值,然后將HCC患者分為低風險組(低于中位值)和高風險組(高于中位值)。采用Kaplan-Meier(K-M)生存曲線對高風險組和低風險組進行分層分析,并采用log-rank檢驗分析有無統計學意義。采用受試者工作特征(receiver operating characteristic,ROC)曲線來檢驗風險模型在生存預測中的效率,ROC曲線下面積(area under the ROC curve,AUC)用于衡量模型的預測效率。
1.4 統計分析
數據管理、統計分析和繪圖主要基于R-4.0.2(https://www.r-project.org)。用對數秩檢驗確定Kaplan-Meier法生成的生存曲線之間的差異。P ≤0.05被認為有統計學意義。
2 結果
2.1 數據獲取和差異表達的ARGs
在TCGA數據庫中提取了377名原發性HCC患者的基因表達譜和臨床數據見表1。從HADb數據庫共獲得232個ARGs,與TCGA-LIHC數據進行比較,最終納入204個有效ARGs。隨后,通過基因表達的差異分析,共鑒定出64個ARGs發生顯著變化,包括60個上調基因和4個下調基因(見圖1a~b)。圖1c的箱式圖顯示了癌組織和正常組織差異ARGs的表達情況。


a~b. 肝癌組織與正常組織相比差異表達的64個自噬相關基因的熱圖和火山圖,其中火山圖中紅點代表顯著上調基因,綠點代表顯著下調基因,黑點代表無顯著差異的基因;c. 64個差異基因的箱式圖,紅色為癌組織樣本,綠色為正常組織樣本
Figure1. Differential expression profile of autophagy related genes between hepatocellular carcinoma and normal liver tissuea-b. the heat map and volcano map of 64 autophagy related genes differentially expressed in HCC tissues compared with normal tissues. In the volcano map, red dots represent significantly up-regulated genes, green dots represent significantly down-regulated genes, and black dots represent genes with no significant difference. c. the box diagram of 64 differential genes is shown. The red stands for cancer tissues and the green represents normal tissues
2.2 差異表達ARGs的功能富集
隨后我們對這64個差異基因進行功能富集分析,圖2展示了GO富集和KEGG信號通路分析的前30個結果。GO和KEGG分析發現,這些差異的ARGs主要參與了自噬、凋亡信號通路、IL-17信號通路、PI3K-Akt信號通路和p53信號通路等。

a~b. 通過GO分析顯示了差異ARGs參與的生物學過程和功能;c~d. 差異ARGs對癌細胞信號通路發揮潛在作用的KEGG分析
Figure2. Gene function enrichment analysis of differential ARGsa-b. the biological process and function of different ARGs through GO analysis; c-d. the KEGG analysis of the potential role of different ARGs in cancer cell signaling pathway
2.3 預后相關的ARGs的確定
為了分析ARGs在HCC進展中的作用,我們篩選了與預后顯著相關的ARGs。單因素Cox回歸分析發現14個與OS相關的ARGs且均為危險因素(如表2所示)。隨后,多因素Cox回歸分析發現5個與OS顯著相關的ARGs,分別是TMEM74、BIRC5、SQSTM1、CAPN10和HSPB8(如表3所示)。在此基礎上,我們構建了基于自噬基因相關的HCC預后風險模型,以更好地預測HCC患者的臨床預后。所構建的評分模型公式為:0.443 97 × EXPTMEM74 + 0.153 91 × EXPBIRC5 + 0.176 14 × EXPSQSTM1 + 0.752 93 × EXPCAPN10 +0.120 46 × EXPHSPB8(EXP代表不同的自噬基因的表達量)。圖3a~c分別顯示最終5個ARGs在TCGA數據集中的分布、不同組中患者的生存狀態和表達熱圖。隨后,通過繪制K-M生存曲線,分析高風險組和低風險組的不同生存時間,以確定該模型預測HCC患者臨床預后的能力,圖3d結果顯示高風險組HCC患者生存率明顯低于低風險組HCC患者。



a~b. 不同模型風險評分分組HCC患者生存結局的相關性,可以看到隨著風險評分增加,HCC患者的生存時間逐漸下降;c. 高風險組和低風險組患者差異ARGs的表達情況;d. K-M圖顯示,與低風險組HCC患者相比,高風險組患者的生存時間明顯縮短
Figure3. The correlation study between the prognostic risk model score and the survival rate of HCC patientsa-b. the correlation of the survival outcome of HCC patients in different risk score groups. It can be seen that the survival time of HCC patients gradually decreases as the risk score increases. c. different expressions of ARGs between high-risk group and low-risk group. d. K-M chart shows that compared with HCC patients in the low-risk group, the survival time of patients in the high-risk group is significantly shorter
2.4 基于ARGs的預后模型評分為HCC預后的獨立風險因素
在調整了年齡、性別、分化程度、分期、腫瘤大小、淋巴結轉移和遠處轉移等因素后,如圖4a所示的單因素分析(HR = 1.544,95% CI = 1.359~1.754,P < 0.001)和如圖4b所示的多因素分析(HR = 1.475,95% CI = 1.280~1.699,P < 0.001)均發現模型的風險評分是肝癌患者的獨立預后指標。5年生存率曲線的AUC值為0.739,明顯高于年齡(0.541)、性別(0.501)、腫瘤分化程度(0.480)、腫瘤分期(0.699)、腫瘤大小(0.700)、轉移狀況(0.509)和淋巴結轉移狀況(0.514)。這表明基于ARGs的預后模型在一定程度上能夠預測HCC患者的生存,見圖4c。

a~b. 單因素Cox回歸分析和多因素Cox回歸分析的森林圖;c. 基于差異ARGs的預后風險模型預測HCC患者OS的曲線下面積
Figure4. The prediction model based on differential ARGs shows good prediction abilitya-b. forest plots for univariate Cox regression analysis and multivariate Cox regression analysis; c. the area under the curve of the prognostic risk model based on differential ARGs for predicting OS in HCC patients
3 討論
盡管有大量研究報道自噬與HCC的發生發展、轉移和耐藥有關,但ARGs在HCC中的具體功能及其臨床意義尚不明晰。此外,某些針對ARGs開展的單基因研究雖能預測HCC患者的預后,但仍具有局限性。因此,從ARGs數據庫中篩選出多個差異基因構建HCC預后模型具有重要意義。本研究最終篩選出5個預后相關的ARGs,并且構建了一個可用于預測HCC患者預后的模型,這為HCC患者進行個體化治療提供了一個新的思路。
我們在這項研究中,分析了TCGA數據庫中HCC患者的高通量轉錄組數據,以確定潛在的預后相關ARGs。與正常組織相比,HCC患者癌組織中共有64個ARGs表達有顯著差異,其中60個基因表達上調,4個基因表達下調。然后對這些基因進行單因素Cox回歸分析,確定14個與HCC患者OS相關的ARGs。隨后通過多因素Cox回歸分析,最終確定了5個差異表達ARGs(TMEM74、BIRC5、SQSTM1、CAPN10和HSPB8),并用于構建基于加權風險評分的HCC預后模型。生存分析顯示,與風險評分較高組相比,低分組表現出更好的OS。利用多指標ROC曲線發現本研究構建的ARGs相關預后模型有較好的預測能力。
TMEM74即跨膜蛋白74,是一種溶酶體跨膜蛋白,主要誘導細胞自噬[12]。有研究表明TMEM74的TM結構域與凋亡誘導因子BIK的BH3結構域結合,并且抑制BIK誘導的細胞凋亡[13]。此外還有研究表明TMEM74能夠誘導自噬從而促進HepG2細胞的增殖[14]。研究人員表明,BIRC5在多種惡性腫瘤中有高表達,并且預示著這些患者的臨床預后不良,包括乳腺癌、肺腺癌、神經母細胞惡性腫瘤、胰腺癌和食管癌等[15-17]。Wang等[18]的研究結果與我們的一致,BIRC5在HCC組織中高表達,并且可以預測HCC患者的預后,提示BIRC5可能參與HCC的發生和發展。此外,有研究表明SQSTM1是包括HCC在內的多種癌癥的潛在癌基因[19]。P62是SQSTM1的表達產物,是一種多功能蛋白,作為接頭蛋白可以誘導自噬進而導致特定靶蛋白的降解[20]。已經有研究證明大量磷酸化的SQSTM1/p62會聚集在HCC患者的癌組織,而它的抑制劑可能會抑制細胞增殖[21-22]。CAPN10作為鈣蛋白酶家族的一員,是能被細胞內鈣離子激活的半胱氨酸蛋白酶,同時還是2型糖尿病的易感基因[23-24]。有研究表明它能將微管相關蛋白1家族的蛋白加工成重鏈和輕鏈,并調節其與微管和肌動蛋白絲的結合活性[25-26]。此外,研究發現它參與了多種癌癥的發生發展,包括食管癌、胰腺癌、結腸癌和喉癌等,但目前關于其在HCC發生發展中的作用尚不明確[27-29]。早在2015年就有研究發現熱休克蛋白家族基因表達的上調與HBV相關的早期HCC患者的預后不良有關[30-31]。隨后,又有研究發現HSPB8可以通過PI3K/AKT信號通路參與HCC的發生和轉移[32]。
本研究也具有一定的局限性。首先,該研究納入的數據是回顧性的,存在一定的偏倚;其次,該研究中建立的預后模型需要更多研究進行驗證;最后,模型納入的差異基因所發揮的具體功能仍需進一步探索。后續將在我院已收集的肝癌標本庫中對該預后模型做進一步驗證。與此同時,我們將會對模型得分高者和得分低者進行長期隨訪,來檢驗模型的準確性。
4 結論
總之,我們的研究證明了ARGs在HCC患者預后中的潛在作用,并且成功構建了相關預后模型,包括TMEM74、BIRC5、SQSTM1、CAPN10和HSPB8,該模型對于HCC患者的臨床結局具有良好的預測能力。盡管該模型所納入的基因在HCC中的作用機制還需要進一步研究,但我們的發現為探索ARGs作為HCC治療研發的潛在靶點提供了初步基礎。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:黃煒負責課題設計、采集數據、分析數據、統計分析、起草文章;韓寧、杜凌遙、曹丹負責課題設計、采集數據、分析數據;唐紅負責對文章的知識性內容作出批評性審閱。