引用本文: 孫孝國, 李力, 王金華. 肝細胞癌術后復發相關機理研究以及潛在治療藥物預測. 中國普外基礎與臨床雜志, 2014, 21(10): 1245-1249. doi: 10.7507/1007-9424.20140298 復制
肝細胞癌(hepatocellular carcinoma,HCC)是臨床上常見的惡性程度極高的一類肝臟腫瘤,發病率以肝炎病毒流行的亞洲最高,近年來在歐美的發病率也不斷攀升,每年因HCC致死者達66萬[1-5]。目前,外科手術切除可以有效延長患者的生存期,然而大約66%的患者會在術后幾年之內復發[6-7]。因此,在HCC尚未出現復發轉移之前,及早的預測、診斷,并及時采取有效的措施進行防治就成為能否進一步提高HCC治療效果的關鍵。盡管基因芯片技術及新一代測序技術的應用,已經幫助我們揭示了很多與HCC術后復發相關的分子以及調控關系,不過其中大部分結果對臨床實踐的指導意義有限。因此,如何將這些發現應用于臨床實踐仍需要探索。此外,由于HCC復雜的基因異質性和小樣本量的患者數目都使得對HCC術后復發機理的研究進展緩慢。
本研究通過分析35例HCC術后2年內復發患者及41例未復發患者的基因表達譜數據,挖掘與HCC術后復發相關的基因及其分子機理;通過基因本體論(gene ontology,GO)與生物學通路(pathway)富集分析,發現一些與術后復發相關基因可能涉及的相關生物學功能以及通路,并通過Connectivity Map(cmap)數據庫尋找可能對HCC術后復發相關的小分子藥物,以期能對HCC患者提供一個新的治療切入點和潛在的新型治療藥物。
1 資料和方法
1.1 基因表達譜數據以及癌基因數據來源
基因表達譜數據(E-MEXP-84與E-TABM-292)來自歐洲分子生物學實驗數據庫(http://www.ebi.ac.uk/arrayexpress/)。該數據包含76個HCC患者的基因表達譜數據(實驗平臺:Affymetrix GeneChip Human Genome HG-U133A與Affymetrix GeneChip Human Genome HG-U133B),包括35例術后2年內復發的HCC患者樣本數據,41例未復發的HCC患者樣本數據[
1.2 數據預處理以及差異表達基因篩選
為了得到HCC術后相關的顯著差異表達基因,本研究使用基因表達控制臺軟件〔gene expression console software(RMA算法)〕對表達譜原始數據進行預處理,然后使用微陣列芯片顯著性分析(significant analysis of microarray,SAM)算法篩選差異表達基因(基于EXCEL的SAM軟件)。本研究篩選差異表達基因的閾值為:|差異倍數(fold change)|>2,q值<0.05。
1.3 GO與pathway富集分析
為了在分子水平上對HCC術后復發的代謝變化情況進行分析研究,本研究從京都基因與基因組百科全書生物通路數據庫(KEGG)與GO數據庫(KEGG數據庫:http://www.kegg.jp/kegg/pathway.html;GO數據庫:http://geneontology.org/)中獲得相關功能分類以及生物學通路數據,然后使用BiNGO軟件[
1.4 cmap數據庫分析
cmap數據庫[12]收集了在各種生物活性小分子活性干預情況下人類細胞全基因組轉錄表達數據,其中包括6 100組小分子干預實驗數據(包括小分子干預組和正常對照組數據)和7 056組基因表達譜。因此,利用Connectivity Map識別和整理體內細胞處于各種狀態的基因組“識別標志”(signature),研究人員可以精確地預測一種新穎的治療性化合物的分子活性,以及得到應用到癌癥之類疾病治療上的新藥物的途徑,也使得研究一個具體候選藥物的研究人員可以將一個識別標志輸入到數據庫中,來發現該藥物可能的新作用。本研究將HCC術后復發相關差異表達基因輸入cmap數據庫,并且對小分子干預引起的差異表達基因進行了比較分析,以期發現正常細胞中和肝癌細胞中類似的基因表達譜,或者確定小干預分子。其中差異表達基因被分為上調和下調兩類。然后我們定義了一個富集值,用來表示cmap數據庫中經過小分子干預后的差異表達基因數據與通過基因集富集分析結果之間的近似度,該數值在-1與1之間,該數值越接近1,表明小分子干預結果越能模擬正常細胞中的基因表達情況;該數值越接近-1,則表明小分子干預結果越能模擬肝癌細胞中的基因表達情況。
2 結果
2.1 對不同病理狀態下的基因表達差異情況的識別
首先,本研究將76個樣本的HCC表達譜芯片數據進行預處理,得到標準化的表達譜數據。而后,為了篩選可能與術后復發相關的基因,本研究應用SAM分析以尋找兩組樣本間差異表達基因(|差異倍數|>2,P < 0.05)。結果得到316個差異表達基因,這316個基因中有61個基因都屬于已知癌基因(超幾何分布P=0.034),其已知癌基因來源于癌癥基因普查數據庫(cancer gene census database)[9]。該結果提示,本研究得到的差異表達基因與腫瘤顯著相關。
2.2 差異表達基因的GO與pathway富集分析結果
本研究針對316個差異表達基因,分別應用BiNGO軟件[10]中Goslim數據庫進行GO功能富集分析和KOBAS軟件[11]進行KEGG通路富集分析。結果發現:差異表達基因大多富集到“蛋白綁定”、“信號轉導”、“蛋白激酶活性”等GO功能以及“黏著斑信號通路”、“MAPK信號通路”等KEGG通路(表 1)。

2.3 cmap數據庫分析結果
本研究使用基因集富集分析方法對cmap數據庫中的差異表達基因進行比較研究,結果獲得了9個可能與HCC顯著相關的生物活性小分子(P<0.05),其中“富集度”表示小分子與HCC術后復發的相關性,靠近+1表示對HCC術后復發有治療作用,而靠近-1則表示該小分子有致癌作用。結果見表 2。由表 2可見,一些小分子可能有防治HCC術后復發的功能,如班布特羅(富集值=0.667)和洛伐他汀(富集值=0.658);同時也發現了一些具有強致癌作用的小分子,如恩波吡維銨(富集值=-0.818)和替卡西林(富集值=-0.846)。

3 討論
HCC是一種男性易發的常見癌癥,其發病率與性別、年齡以及肝臟疾病的持續時間有關。然而無論其病因如何,肝硬變始終是HCC發病的最重要的因素[13],而長期酗酒是造成肝硬變的重要原因[14-15];另外,對于慢性乙肝患者而言,黃曲霉素的攝入也是引起HCC的重要因素之一[16]。盡管外科手術已經成為HCC治療的重要方法,但術后腫瘤復發依舊成為HCC患者臨床治療的重大挑戰[17]。
本研究收集35例術后復發與41例術后未復發HCC患者的基因表達譜數據,通過差異基因分析得到316個與HCC術后復發相關的基因,其中大量的基因與腫瘤相關,如晝夜節律蛋白(PER2)、信號傳導子、轉錄激活子(STAT3)以及AKT3都是與腫瘤細胞有關的分子[18-20]。然后,針對這些術后復發相關基因進行功能以及通路富集分析,結果發現:差異表達基因大多富集到“蛋白綁定”、“信號轉導”、“蛋白激酶活性”等GO功能以及“黏著斑信號通路”、“MAPK信號通路”等KEGG通路。其相關功能都與HCC的發生發展有重要關系[21]。進一步探討差異表達基因功能富集分析得到的相關功能與通路,可以發現這些功能都是HCC細胞的一些共性特征。當HCC發生時,細胞最顯著的變化發生在細胞膜和細胞核上。另外,細胞內的一些激酶活性、蛋白質結合能力等也發生了改變,而這些分子在細胞信號轉導轉化中發揮重要作用。所有這些分子引起的變化均與癌癥緊密相關,同時有關細胞進程、增殖、凋亡等功能也顯著的聚集。KEGG通路富集的結果發現一些與腫瘤轉移相關的通路如“黏著斑通路”以及“MAPK信號通路”,HCC細胞中黏著斑通路發生了較大的變化。黏著斑主要起著細胞在基質中的鏈接作用,在細胞的運動性、增殖和分化中發揮著重要的作用。一些黏著斑是細胞膜表面信號受體和細胞內肌動蛋白纖維的鏈接機構,甚至直接作為信號分子在例如蛋白激酶、磷酸酶等系統中發揮作用。因此這些通路發生的變化可以直接阻塞細胞中正常的信號轉導途徑,從而使得肝細胞有序地進入癌變過程。由于信號轉導途徑被阻塞,許多重要的信號轉導通路都發生變化。而MAPK信號通路是細胞內一條重要的信號轉導通路,它對基因表達、細胞的增殖、分化和運動起著重要的調節作用。總之,HCC細胞通過黏著斑對細胞內和細胞間的信號轉導通路進行影響,從而引起細胞內重要的信號轉導通路的非正常表達(MARK信號通路、TGF-beta信號通路和神經營養因子信號通路)。一方面,HCC細胞阻止了人體免疫系統的響應,影響了正常細胞的增殖和凋亡;另一方面,HCC細胞改變了正常細胞的形態和行為特征,引導其轉化為癌癥細胞從而最終導致HCC的發生。因此,對HCC的臨床病例特征及分子機理的研究,以及對不同病理程度的HCC患者的評估和分層診斷,以及對HCC的臨床治療管理都有著很大的幫助。研究中發現的基因集可以作為重要的基因庫,為新型診斷和生物治療標志物的確定和研究提供重要參考,為部分肝切除手術后的HCC患者的臨床管理發揮重要作用。
目前,HCC治療的新藥研究相對緊缺。根據差異表達基因的情況以及從cmap數據庫中獲得的小分子的信息,我們發現一系列的小分子,這些小分子可以在一定程度上模擬與正常細胞相比的HCC細胞的不同狀況,這就意味著這些小分子可能具有修復因HCC引起的肝代謝的失調的作用。其中洛伐他汀已被發現對多種癌癥具有治療作用,例如,Martirosyan等[22]研究發現,洛伐他汀有促進卵巢癌細胞的凋亡,并切可以與阿霉素聯合用藥,達到治療的效果。Sanli等[23]發現,洛伐他汀可以增加肺癌細胞對電離輻射的敏感性,增強放療作用。本研究同時也發現了一些具有強致癌作用的小分子,如恩波吡維銨(富集值=-0.818)和替卡西林(富集值=-0.846)。值得一提的是目前有一些報道發現這兩種可能的致癌分子反而具有一定的腫瘤治療作用[24-26]。
總之,本研究通過分析一套HCC術后復發與未復發的全基因組表達譜數據,解析了與復發相關的差異表達基因主要涉及的生物學功能以及通路,同時預測了可能對HCC術后復發具有治療作用的一些潛在小分子,對防治HCC術后復發具有積極的意義。但這些潛在的小分子是否具有治療作用且具體治療靶點以及機理還需要進一步的實驗去研究。
肝細胞癌(hepatocellular carcinoma,HCC)是臨床上常見的惡性程度極高的一類肝臟腫瘤,發病率以肝炎病毒流行的亞洲最高,近年來在歐美的發病率也不斷攀升,每年因HCC致死者達66萬[1-5]。目前,外科手術切除可以有效延長患者的生存期,然而大約66%的患者會在術后幾年之內復發[6-7]。因此,在HCC尚未出現復發轉移之前,及早的預測、診斷,并及時采取有效的措施進行防治就成為能否進一步提高HCC治療效果的關鍵。盡管基因芯片技術及新一代測序技術的應用,已經幫助我們揭示了很多與HCC術后復發相關的分子以及調控關系,不過其中大部分結果對臨床實踐的指導意義有限。因此,如何將這些發現應用于臨床實踐仍需要探索。此外,由于HCC復雜的基因異質性和小樣本量的患者數目都使得對HCC術后復發機理的研究進展緩慢。
本研究通過分析35例HCC術后2年內復發患者及41例未復發患者的基因表達譜數據,挖掘與HCC術后復發相關的基因及其分子機理;通過基因本體論(gene ontology,GO)與生物學通路(pathway)富集分析,發現一些與術后復發相關基因可能涉及的相關生物學功能以及通路,并通過Connectivity Map(cmap)數據庫尋找可能對HCC術后復發相關的小分子藥物,以期能對HCC患者提供一個新的治療切入點和潛在的新型治療藥物。
1 資料和方法
1.1 基因表達譜數據以及癌基因數據來源
基因表達譜數據(E-MEXP-84與E-TABM-292)來自歐洲分子生物學實驗數據庫(http://www.ebi.ac.uk/arrayexpress/)。該數據包含76個HCC患者的基因表達譜數據(實驗平臺:Affymetrix GeneChip Human Genome HG-U133A與Affymetrix GeneChip Human Genome HG-U133B),包括35例術后2年內復發的HCC患者樣本數據,41例未復發的HCC患者樣本數據[
1.2 數據預處理以及差異表達基因篩選
為了得到HCC術后相關的顯著差異表達基因,本研究使用基因表達控制臺軟件〔gene expression console software(RMA算法)〕對表達譜原始數據進行預處理,然后使用微陣列芯片顯著性分析(significant analysis of microarray,SAM)算法篩選差異表達基因(基于EXCEL的SAM軟件)。本研究篩選差異表達基因的閾值為:|差異倍數(fold change)|>2,q值<0.05。
1.3 GO與pathway富集分析
為了在分子水平上對HCC術后復發的代謝變化情況進行分析研究,本研究從京都基因與基因組百科全書生物通路數據庫(KEGG)與GO數據庫(KEGG數據庫:http://www.kegg.jp/kegg/pathway.html;GO數據庫:http://geneontology.org/)中獲得相關功能分類以及生物學通路數據,然后使用BiNGO軟件[
1.4 cmap數據庫分析
cmap數據庫[12]收集了在各種生物活性小分子活性干預情況下人類細胞全基因組轉錄表達數據,其中包括6 100組小分子干預實驗數據(包括小分子干預組和正常對照組數據)和7 056組基因表達譜。因此,利用Connectivity Map識別和整理體內細胞處于各種狀態的基因組“識別標志”(signature),研究人員可以精確地預測一種新穎的治療性化合物的分子活性,以及得到應用到癌癥之類疾病治療上的新藥物的途徑,也使得研究一個具體候選藥物的研究人員可以將一個識別標志輸入到數據庫中,來發現該藥物可能的新作用。本研究將HCC術后復發相關差異表達基因輸入cmap數據庫,并且對小分子干預引起的差異表達基因進行了比較分析,以期發現正常細胞中和肝癌細胞中類似的基因表達譜,或者確定小干預分子。其中差異表達基因被分為上調和下調兩類。然后我們定義了一個富集值,用來表示cmap數據庫中經過小分子干預后的差異表達基因數據與通過基因集富集分析結果之間的近似度,該數值在-1與1之間,該數值越接近1,表明小分子干預結果越能模擬正常細胞中的基因表達情況;該數值越接近-1,則表明小分子干預結果越能模擬肝癌細胞中的基因表達情況。
2 結果
2.1 對不同病理狀態下的基因表達差異情況的識別
首先,本研究將76個樣本的HCC表達譜芯片數據進行預處理,得到標準化的表達譜數據。而后,為了篩選可能與術后復發相關的基因,本研究應用SAM分析以尋找兩組樣本間差異表達基因(|差異倍數|>2,P < 0.05)。結果得到316個差異表達基因,這316個基因中有61個基因都屬于已知癌基因(超幾何分布P=0.034),其已知癌基因來源于癌癥基因普查數據庫(cancer gene census database)[9]。該結果提示,本研究得到的差異表達基因與腫瘤顯著相關。
2.2 差異表達基因的GO與pathway富集分析結果
本研究針對316個差異表達基因,分別應用BiNGO軟件[10]中Goslim數據庫進行GO功能富集分析和KOBAS軟件[11]進行KEGG通路富集分析。結果發現:差異表達基因大多富集到“蛋白綁定”、“信號轉導”、“蛋白激酶活性”等GO功能以及“黏著斑信號通路”、“MAPK信號通路”等KEGG通路(表 1)。

2.3 cmap數據庫分析結果
本研究使用基因集富集分析方法對cmap數據庫中的差異表達基因進行比較研究,結果獲得了9個可能與HCC顯著相關的生物活性小分子(P<0.05),其中“富集度”表示小分子與HCC術后復發的相關性,靠近+1表示對HCC術后復發有治療作用,而靠近-1則表示該小分子有致癌作用。結果見表 2。由表 2可見,一些小分子可能有防治HCC術后復發的功能,如班布特羅(富集值=0.667)和洛伐他汀(富集值=0.658);同時也發現了一些具有強致癌作用的小分子,如恩波吡維銨(富集值=-0.818)和替卡西林(富集值=-0.846)。

3 討論
HCC是一種男性易發的常見癌癥,其發病率與性別、年齡以及肝臟疾病的持續時間有關。然而無論其病因如何,肝硬變始終是HCC發病的最重要的因素[13],而長期酗酒是造成肝硬變的重要原因[14-15];另外,對于慢性乙肝患者而言,黃曲霉素的攝入也是引起HCC的重要因素之一[16]。盡管外科手術已經成為HCC治療的重要方法,但術后腫瘤復發依舊成為HCC患者臨床治療的重大挑戰[17]。
本研究收集35例術后復發與41例術后未復發HCC患者的基因表達譜數據,通過差異基因分析得到316個與HCC術后復發相關的基因,其中大量的基因與腫瘤相關,如晝夜節律蛋白(PER2)、信號傳導子、轉錄激活子(STAT3)以及AKT3都是與腫瘤細胞有關的分子[18-20]。然后,針對這些術后復發相關基因進行功能以及通路富集分析,結果發現:差異表達基因大多富集到“蛋白綁定”、“信號轉導”、“蛋白激酶活性”等GO功能以及“黏著斑信號通路”、“MAPK信號通路”等KEGG通路。其相關功能都與HCC的發生發展有重要關系[21]。進一步探討差異表達基因功能富集分析得到的相關功能與通路,可以發現這些功能都是HCC細胞的一些共性特征。當HCC發生時,細胞最顯著的變化發生在細胞膜和細胞核上。另外,細胞內的一些激酶活性、蛋白質結合能力等也發生了改變,而這些分子在細胞信號轉導轉化中發揮重要作用。所有這些分子引起的變化均與癌癥緊密相關,同時有關細胞進程、增殖、凋亡等功能也顯著的聚集。KEGG通路富集的結果發現一些與腫瘤轉移相關的通路如“黏著斑通路”以及“MAPK信號通路”,HCC細胞中黏著斑通路發生了較大的變化。黏著斑主要起著細胞在基質中的鏈接作用,在細胞的運動性、增殖和分化中發揮著重要的作用。一些黏著斑是細胞膜表面信號受體和細胞內肌動蛋白纖維的鏈接機構,甚至直接作為信號分子在例如蛋白激酶、磷酸酶等系統中發揮作用。因此這些通路發生的變化可以直接阻塞細胞中正常的信號轉導途徑,從而使得肝細胞有序地進入癌變過程。由于信號轉導途徑被阻塞,許多重要的信號轉導通路都發生變化。而MAPK信號通路是細胞內一條重要的信號轉導通路,它對基因表達、細胞的增殖、分化和運動起著重要的調節作用。總之,HCC細胞通過黏著斑對細胞內和細胞間的信號轉導通路進行影響,從而引起細胞內重要的信號轉導通路的非正常表達(MARK信號通路、TGF-beta信號通路和神經營養因子信號通路)。一方面,HCC細胞阻止了人體免疫系統的響應,影響了正常細胞的增殖和凋亡;另一方面,HCC細胞改變了正常細胞的形態和行為特征,引導其轉化為癌癥細胞從而最終導致HCC的發生。因此,對HCC的臨床病例特征及分子機理的研究,以及對不同病理程度的HCC患者的評估和分層診斷,以及對HCC的臨床治療管理都有著很大的幫助。研究中發現的基因集可以作為重要的基因庫,為新型診斷和生物治療標志物的確定和研究提供重要參考,為部分肝切除手術后的HCC患者的臨床管理發揮重要作用。
目前,HCC治療的新藥研究相對緊缺。根據差異表達基因的情況以及從cmap數據庫中獲得的小分子的信息,我們發現一系列的小分子,這些小分子可以在一定程度上模擬與正常細胞相比的HCC細胞的不同狀況,這就意味著這些小分子可能具有修復因HCC引起的肝代謝的失調的作用。其中洛伐他汀已被發現對多種癌癥具有治療作用,例如,Martirosyan等[22]研究發現,洛伐他汀有促進卵巢癌細胞的凋亡,并切可以與阿霉素聯合用藥,達到治療的效果。Sanli等[23]發現,洛伐他汀可以增加肺癌細胞對電離輻射的敏感性,增強放療作用。本研究同時也發現了一些具有強致癌作用的小分子,如恩波吡維銨(富集值=-0.818)和替卡西林(富集值=-0.846)。值得一提的是目前有一些報道發現這兩種可能的致癌分子反而具有一定的腫瘤治療作用[24-26]。
總之,本研究通過分析一套HCC術后復發與未復發的全基因組表達譜數據,解析了與復發相關的差異表達基因主要涉及的生物學功能以及通路,同時預測了可能對HCC術后復發具有治療作用的一些潛在小分子,對防治HCC術后復發具有積極的意義。但這些潛在的小分子是否具有治療作用且具體治療靶點以及機理還需要進一步的實驗去研究。