引用本文: 嚴永鋒, 王宇婷, 朱陳, 朱健, 樊春筍, 白方舟, 陸健泉, 杜靈彬, 任建松, 趙建軍, 陳陶陽, 曲春楓, 石菊芳. 肝癌篩查技術準確性的 Meta 分析. 中國循證醫學雜志, 2018, 18(5): 418-427. doi: 10.7507/1672-2531.201802055 復制
肝癌是一種惡性程度高、轉移性強的腫瘤,據國際癌癥研究署 Globocan 2012 數據顯示,2012 年全球肝癌新發病例 78.2 萬,其中我國新發 39.5 萬,占比超過 50%[1]。目前肝癌是我國第四位常見惡性腫瘤,死亡率位列第二位[2]。據估計,2015 年全國肝癌的發病數為 46.61 萬,死亡數為 42.21 萬[3]。中晚期肝癌患者的預后非常差(死亡率與發病率的總體比率為 0.95[1]),因此通過篩查或監測發現早期肝癌是實現肝癌早診早治、改善患者預后和提高生存率的主要途徑。
腹部超聲檢查因操作簡便、靈活直觀、無創便攜等特點,是臨床上最常用的肝臟影像學檢查方法,常規超聲篩查可以早期、敏感地檢出肝內可疑占位性病變,準確鑒別囊性或實質性占位,并觀察肝內或腹部有無其他相關轉移灶,血清甲胎蛋白(alpha-fetoprotein,AFP)是臨床上用于肝癌診斷的主要腫瘤標志物[4],因此甲胎蛋白和肝臟超聲檢查是目前肝癌早期篩查的主要手段。2004 年, Bruno 等[5]對甲胎蛋白和超聲技術篩查肝癌進行了系統評價,指出甲胎蛋白篩查肝癌的靈敏度為 39%~65%,特異度為 76%~94%,但該研究僅納入 7 個研究,未對納入研究的基本特征、偏倚風險等關鍵要素進行分析,且未評價不同截斷值血清甲胎蛋白的診斷價值。本研究全面搜集近 30 余年甲胎蛋白和超聲技術對肝癌篩查診斷的相關研究進行 Meta 分析,探究不同甲胎蛋白截斷值的診斷價值,并評價甲胎蛋白聯合超聲技術診斷的準確性,以期為今后肝癌診斷標準的選擇和高危人群篩查提供合理參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入研究
肝癌篩查的診斷性試驗,文種包括中文和英文。
1.1.2 研究對象
篩查對象為國內外乙肝病毒攜帶者、肝硬化患者或者一般人群。
1.1.3 診斷方法
待評價方法為不同截斷值的血清甲胎蛋白檢測及肝臟超聲篩查技術。
1.1.4 結局指標
敏感度(sensitivity,Sen)、特異度(specificity,Spe)、陽性似然比(positive likelihood ratio,+LR)、陰性似然比(negative likelihood ratio,–LR)、診斷比值比(diagnosis odds ratios,DOR)、SROC 曲線下面積(AUC)。
1.1.5 排除標準
① 重復報道的文獻;② 研究對象樣本量小于 100 例;③ 無法獲取關鍵數據或指標,如具體的血清甲胎蛋白檢測截斷值。
1.2 文獻檢索策略
計算機檢索 PubMed、The Cochrane Library、EMbase、Web of Science、CNKI、CBM、WanFang Data 和 VIP 數據庫,搜集與肝癌篩查相關的診斷性試驗,檢索時限均為從 1980 年 1 月至 2017 年 12 月。檢索采用主題詞和自由詞相結合的方式進行。同時手工檢索符合條件的相關系統評價的參考文獻進行補充。英文檢索詞包括:liver cancer、liver neoplasms、mass screening、alpha-fetoproteins、ultrasonography、sensitivity、specificity 等;中文檢索詞包括:肝癌、肝腫瘤、篩查、甲胎蛋白、超聲、靈敏度、特異度等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究人員依照預定的納入排除標準進行文獻篩選,并按既定數據采集表提取數據,如遇分歧時則討論解決。資料提取主要包括以下內容:① 納入研究的基本信息,包括第一作者、發表年份、國家(地區)等內容;② 篩查信息,包括研究時間、研究對象年齡、樣本量、篩查技術;③ 診斷試驗的主要參數:真陽性、假陽性、假陰性、真陰性。
1.4 納入研究的偏倚風險評價
采用 QUADAS-2 量表進行偏倚風險評價。該量表是系統評價中診斷性試驗質量評價的工具[6],包含偏倚評價和適用性兩部分。偏倚評價包括四個領域:病例選擇、待評價試驗、金標準、病例流程和進展情況;適用性包括三個領域:病例選擇、待評價試驗和金標準。所有領域的評價結果分為高風險、低風險和不清楚。
1.5 統計分析
采用 Meta-Disc1.4 軟件進行 Meta 分析。通過 ROC 平面圖判斷 SROC 曲線分布是否呈“肩背狀”,計算 Spearman 相關系數分析有無閾值效應所致異質性。如無閾值效應,采用隨機效應模型進行 Meta 分析,計算合并后的靈敏度、特異度、陽性似然比、陰性似然比以及診斷優勢比。
根據不同篩查方法將納入研究分為單獨甲胎蛋白篩查、單獨超聲篩查以及甲胎蛋白與超聲聯合篩查三種進行評價。其中單獨甲胎蛋白篩查根據臨床實踐經驗,基于不同截斷值(20 ng/mL、200 ng/mL 及 400 ng/mL)進行亞組分析。通過卡方檢驗與 I2 統計量分析文獻異質性。同時利用 Stata12.0 軟件繪制 Deek’s 漏斗圖檢驗文獻發表偏倚,P<0.05 表明存在發表偏倚。
2 結果
2.1 文獻篩檢流程及結果
初檢共獲得相關文獻 797 篇,經層層篩選,最終納入 54 篇文獻[7-60]。文獻篩選流程及結果見圖 1。

*所檢索數據庫及相應文獻數量具體如下:PubMed(
2.2 納入研究的基本特征
納入文獻的基本特征見表 1。

2.3 納入研究偏倚風險評價
納入研究的偏倚風險評價結果見表 2。

2.4 Meta 分析
單獨甲胎蛋白篩查(不同截斷值)、單獨超聲篩查以及兩者聯合篩查的 ROC 平面圖均未呈現“肩背狀”分布,Spearman 相關系數均提示不存在閾值效應(P>0.05)。異質性檢驗結果表明不同研究間存在異質性,因此采用隨機效應模型進行 Meta 分析。具體結果見表 3。

Meta 分析結果顯示單獨使用篩查 AFP,截斷值在 20 ng/mL、200 ng/mL 和 400 ng/mL 的 SROC 曲線下面積分別為 0.83,0.78 和 0.80;單獨超聲篩查的 SROC 曲線下面積為 0.98;AFP 20 ng/mL 聯合超聲篩查的 SROC 曲線下面積為 0.98。見圖 2。

a:AFP 20 ng/mL 的 SROC 曲線;b:AFP 200 ng/mL 的 SROC 曲線;c:AFP 400 ng/mL 的 SROC 曲線;d:單獨肝臟超聲篩查的 SROC 曲線;e:AFP 20 ng/mL 聯合超聲篩查的 SROC 曲線
2.5 基于中國人群的肝癌篩查技術準確性評估
在納入的 54 個研究中有 41 個是基于中國人群的肝癌診斷試驗研究,結果發現基于中國人群,單獨 AFP 20ng/mL 篩查的靈敏度和特異度可達到 0.73[95%CI(0.71,0.74)]和 0.93[95%CI(0.93,0.93)],單獨超聲篩查靈敏度和特異度分別為 0.76[95%CI(0.70,0.80)]和 0.97[95%CI(0.97,0.97)],AFP 20 ng/mL 合并超聲篩查靈敏度和特異度提高至 0.97[95%CI(0.95,0.98)]和 0.98[95%CI(0.97,0.98)],這表明使用 AFP 20 ng/mL 合并超聲篩查的診斷準確性更佳,也更適合于中國人群的肝癌篩查。
2.6 發表偏倚
以診斷優勢比為因變量,1/有效樣本容量的平方根[root(ESS)]為自變量,采用 Stata 12.0 軟件繪制漏斗圖(圖 3)。漏斗圖結果表明不同截斷值的單獨甲胎蛋白篩查、單獨肝臟超聲篩查以及兩者聯合篩查的納入研究均不存在發表偏倚(P 均>0.05)。

a:單獨 AFP 20 ng/mL 篩查;b:單獨 AFP 200 ng/mL 篩查;c:單獨 AFP 400 ng/mL 篩查;d:單獨肝臟超聲篩查;e:AFP 20 ng/mL 聯合肝臟超聲篩查
3 討論
原發性肝癌起病隱匿,預后極差,嚴重影響健康。肝癌的早期篩查與診斷治療可顯著提高肝癌患者遠期生存率,降低病死率,改善預后[61]。AFP 與肝臟超聲檢查是國內外關于肝癌篩查報道中最常用的兩種技術[62, 63]。本研究通過 Meta 分析系統評價了不同肝癌篩查技術的診斷價值。
目前全球多家權威機構均指定 AFP 作為原發性肝癌的特異性腫瘤標志物之一,并強調 AFP 檢測以及連續觀察其在體內的變化情況對于肝癌早期診斷具有重要臨床價值,但當采用不同 AFP 截斷值時,肝癌診斷的靈敏度和特異度均發生變化,從而影響了 AFP 篩查肝癌的準確性[64]。我們評價單獨甲胎蛋白篩查價值時,根據截斷值 20 ng/mL、200 ng/mL、400 ng/mL 分三個亞組,結果顯示診斷截斷值為 20 ng/mL 時,Sen合并 為 0.71[95%CI(0.70,0.72)],顯著高于其余兩組,但 Spe合并0.92[95%CI(0.92,0.93)]略低于其余兩組,可見 AFP 診斷的特異度隨著截斷值的升高而增高,而靈敏度則呈現下降趨勢,這與徐建業[65]等的報道結果一致。
隨著肝癌診斷技術的不斷進步,X 線計算機斷層成像(computed tomography,CT)與磁共振成像(magnetic resonance imaging,MRI)已成為臨床診斷肝癌的常用影像技術[66]。盡管超聲檢查在肝癌診斷方面的靈敏度低于 MRI 與 CT,但超聲檢查具有操作方便、直觀靈活、無創及檢查費用低廉等優勢[67],因此超聲檢查依舊是肝癌篩查中最常用的影像檢查手段。本研究發現單獨超聲篩查 Sen合并 僅為 0.65[95%CI(0.62,0.69)],Spe合并 為 0.97[95%CI(0.96,0.97)],且超聲檢查易受到檢查醫師的手法、經驗以及細致程度的影響,故單獨采用超聲檢查敏感性較低且穩定性不佳,我們認為其不能單獨作為肝癌篩查的技術方法。
早期篩查與診斷對于肝癌的有效治療和改善預后轉歸尤為重要,目前臨床常以影像學技術結合生物標志物檢測的方法診斷肝癌[68]。本研究發現 AFP 20 ng/mL 與肝臟超聲聯合篩查肝癌的 Sen合并 為 0.96[95%CI(0.94,0.98)],Spe合并 為 0.96[95%CI(0.96,0.96)],綜合考慮敏感度與特異度,AFP 與肝臟超聲聯合篩查技術的診斷效能更高;基于中國人群的研究結果同樣表明甲胎蛋白 20 ng/mL 與肝臟超聲聯合篩查能顯著提升篩查靈敏度與特異度,準確性更佳。但原發性肝癌診療規范[69]認為血清 AFP 高于 400 ng/mL 時結合影像學特征時可對肝癌作出臨床診斷,故建議當血清 AFP 高于 20 ng/mL 時需要密切隨訪。
本研究局限性:① 基于血清甲胎蛋白與肝臟超聲聯合篩查技術的納入文獻量偏少,結果有待進一步研究進行驗證;② 盡管本研究進行了廣泛檢索,納入文獻較多,但以中文文獻居多,可能存在語言的發表偏倚;③ 部分納入研究的病例選擇標準不清楚,提示可能會存在病例選擇偏倚。
綜上所述,建議對高危人群每半年進行一次血清甲胎蛋白和肝臟超聲檢查,并考慮以 AFP 20 ng/mL 聯合肝臟超聲篩查作為原發性肝癌篩查標準,對肝癌進行篩查和早期監測。
肝癌是一種惡性程度高、轉移性強的腫瘤,據國際癌癥研究署 Globocan 2012 數據顯示,2012 年全球肝癌新發病例 78.2 萬,其中我國新發 39.5 萬,占比超過 50%[1]。目前肝癌是我國第四位常見惡性腫瘤,死亡率位列第二位[2]。據估計,2015 年全國肝癌的發病數為 46.61 萬,死亡數為 42.21 萬[3]。中晚期肝癌患者的預后非常差(死亡率與發病率的總體比率為 0.95[1]),因此通過篩查或監測發現早期肝癌是實現肝癌早診早治、改善患者預后和提高生存率的主要途徑。
腹部超聲檢查因操作簡便、靈活直觀、無創便攜等特點,是臨床上最常用的肝臟影像學檢查方法,常規超聲篩查可以早期、敏感地檢出肝內可疑占位性病變,準確鑒別囊性或實質性占位,并觀察肝內或腹部有無其他相關轉移灶,血清甲胎蛋白(alpha-fetoprotein,AFP)是臨床上用于肝癌診斷的主要腫瘤標志物[4],因此甲胎蛋白和肝臟超聲檢查是目前肝癌早期篩查的主要手段。2004 年, Bruno 等[5]對甲胎蛋白和超聲技術篩查肝癌進行了系統評價,指出甲胎蛋白篩查肝癌的靈敏度為 39%~65%,特異度為 76%~94%,但該研究僅納入 7 個研究,未對納入研究的基本特征、偏倚風險等關鍵要素進行分析,且未評價不同截斷值血清甲胎蛋白的診斷價值。本研究全面搜集近 30 余年甲胎蛋白和超聲技術對肝癌篩查診斷的相關研究進行 Meta 分析,探究不同甲胎蛋白截斷值的診斷價值,并評價甲胎蛋白聯合超聲技術診斷的準確性,以期為今后肝癌診斷標準的選擇和高危人群篩查提供合理參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入研究
肝癌篩查的診斷性試驗,文種包括中文和英文。
1.1.2 研究對象
篩查對象為國內外乙肝病毒攜帶者、肝硬化患者或者一般人群。
1.1.3 診斷方法
待評價方法為不同截斷值的血清甲胎蛋白檢測及肝臟超聲篩查技術。
1.1.4 結局指標
敏感度(sensitivity,Sen)、特異度(specificity,Spe)、陽性似然比(positive likelihood ratio,+LR)、陰性似然比(negative likelihood ratio,–LR)、診斷比值比(diagnosis odds ratios,DOR)、SROC 曲線下面積(AUC)。
1.1.5 排除標準
① 重復報道的文獻;② 研究對象樣本量小于 100 例;③ 無法獲取關鍵數據或指標,如具體的血清甲胎蛋白檢測截斷值。
1.2 文獻檢索策略
計算機檢索 PubMed、The Cochrane Library、EMbase、Web of Science、CNKI、CBM、WanFang Data 和 VIP 數據庫,搜集與肝癌篩查相關的診斷性試驗,檢索時限均為從 1980 年 1 月至 2017 年 12 月。檢索采用主題詞和自由詞相結合的方式進行。同時手工檢索符合條件的相關系統評價的參考文獻進行補充。英文檢索詞包括:liver cancer、liver neoplasms、mass screening、alpha-fetoproteins、ultrasonography、sensitivity、specificity 等;中文檢索詞包括:肝癌、肝腫瘤、篩查、甲胎蛋白、超聲、靈敏度、特異度等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究人員依照預定的納入排除標準進行文獻篩選,并按既定數據采集表提取數據,如遇分歧時則討論解決。資料提取主要包括以下內容:① 納入研究的基本信息,包括第一作者、發表年份、國家(地區)等內容;② 篩查信息,包括研究時間、研究對象年齡、樣本量、篩查技術;③ 診斷試驗的主要參數:真陽性、假陽性、假陰性、真陰性。
1.4 納入研究的偏倚風險評價
采用 QUADAS-2 量表進行偏倚風險評價。該量表是系統評價中診斷性試驗質量評價的工具[6],包含偏倚評價和適用性兩部分。偏倚評價包括四個領域:病例選擇、待評價試驗、金標準、病例流程和進展情況;適用性包括三個領域:病例選擇、待評價試驗和金標準。所有領域的評價結果分為高風險、低風險和不清楚。
1.5 統計分析
采用 Meta-Disc1.4 軟件進行 Meta 分析。通過 ROC 平面圖判斷 SROC 曲線分布是否呈“肩背狀”,計算 Spearman 相關系數分析有無閾值效應所致異質性。如無閾值效應,采用隨機效應模型進行 Meta 分析,計算合并后的靈敏度、特異度、陽性似然比、陰性似然比以及診斷優勢比。
根據不同篩查方法將納入研究分為單獨甲胎蛋白篩查、單獨超聲篩查以及甲胎蛋白與超聲聯合篩查三種進行評價。其中單獨甲胎蛋白篩查根據臨床實踐經驗,基于不同截斷值(20 ng/mL、200 ng/mL 及 400 ng/mL)進行亞組分析。通過卡方檢驗與 I2 統計量分析文獻異質性。同時利用 Stata12.0 軟件繪制 Deek’s 漏斗圖檢驗文獻發表偏倚,P<0.05 表明存在發表偏倚。
2 結果
2.1 文獻篩檢流程及結果
初檢共獲得相關文獻 797 篇,經層層篩選,最終納入 54 篇文獻[7-60]。文獻篩選流程及結果見圖 1。

*所檢索數據庫及相應文獻數量具體如下:PubMed(
2.2 納入研究的基本特征
納入文獻的基本特征見表 1。

2.3 納入研究偏倚風險評價
納入研究的偏倚風險評價結果見表 2。

2.4 Meta 分析
單獨甲胎蛋白篩查(不同截斷值)、單獨超聲篩查以及兩者聯合篩查的 ROC 平面圖均未呈現“肩背狀”分布,Spearman 相關系數均提示不存在閾值效應(P>0.05)。異質性檢驗結果表明不同研究間存在異質性,因此采用隨機效應模型進行 Meta 分析。具體結果見表 3。

Meta 分析結果顯示單獨使用篩查 AFP,截斷值在 20 ng/mL、200 ng/mL 和 400 ng/mL 的 SROC 曲線下面積分別為 0.83,0.78 和 0.80;單獨超聲篩查的 SROC 曲線下面積為 0.98;AFP 20 ng/mL 聯合超聲篩查的 SROC 曲線下面積為 0.98。見圖 2。

a:AFP 20 ng/mL 的 SROC 曲線;b:AFP 200 ng/mL 的 SROC 曲線;c:AFP 400 ng/mL 的 SROC 曲線;d:單獨肝臟超聲篩查的 SROC 曲線;e:AFP 20 ng/mL 聯合超聲篩查的 SROC 曲線
2.5 基于中國人群的肝癌篩查技術準確性評估
在納入的 54 個研究中有 41 個是基于中國人群的肝癌診斷試驗研究,結果發現基于中國人群,單獨 AFP 20ng/mL 篩查的靈敏度和特異度可達到 0.73[95%CI(0.71,0.74)]和 0.93[95%CI(0.93,0.93)],單獨超聲篩查靈敏度和特異度分別為 0.76[95%CI(0.70,0.80)]和 0.97[95%CI(0.97,0.97)],AFP 20 ng/mL 合并超聲篩查靈敏度和特異度提高至 0.97[95%CI(0.95,0.98)]和 0.98[95%CI(0.97,0.98)],這表明使用 AFP 20 ng/mL 合并超聲篩查的診斷準確性更佳,也更適合于中國人群的肝癌篩查。
2.6 發表偏倚
以診斷優勢比為因變量,1/有效樣本容量的平方根[root(ESS)]為自變量,采用 Stata 12.0 軟件繪制漏斗圖(圖 3)。漏斗圖結果表明不同截斷值的單獨甲胎蛋白篩查、單獨肝臟超聲篩查以及兩者聯合篩查的納入研究均不存在發表偏倚(P 均>0.05)。

a:單獨 AFP 20 ng/mL 篩查;b:單獨 AFP 200 ng/mL 篩查;c:單獨 AFP 400 ng/mL 篩查;d:單獨肝臟超聲篩查;e:AFP 20 ng/mL 聯合肝臟超聲篩查
3 討論
原發性肝癌起病隱匿,預后極差,嚴重影響健康。肝癌的早期篩查與診斷治療可顯著提高肝癌患者遠期生存率,降低病死率,改善預后[61]。AFP 與肝臟超聲檢查是國內外關于肝癌篩查報道中最常用的兩種技術[62, 63]。本研究通過 Meta 分析系統評價了不同肝癌篩查技術的診斷價值。
目前全球多家權威機構均指定 AFP 作為原發性肝癌的特異性腫瘤標志物之一,并強調 AFP 檢測以及連續觀察其在體內的變化情況對于肝癌早期診斷具有重要臨床價值,但當采用不同 AFP 截斷值時,肝癌診斷的靈敏度和特異度均發生變化,從而影響了 AFP 篩查肝癌的準確性[64]。我們評價單獨甲胎蛋白篩查價值時,根據截斷值 20 ng/mL、200 ng/mL、400 ng/mL 分三個亞組,結果顯示診斷截斷值為 20 ng/mL 時,Sen合并 為 0.71[95%CI(0.70,0.72)],顯著高于其余兩組,但 Spe合并0.92[95%CI(0.92,0.93)]略低于其余兩組,可見 AFP 診斷的特異度隨著截斷值的升高而增高,而靈敏度則呈現下降趨勢,這與徐建業[65]等的報道結果一致。
隨著肝癌診斷技術的不斷進步,X 線計算機斷層成像(computed tomography,CT)與磁共振成像(magnetic resonance imaging,MRI)已成為臨床診斷肝癌的常用影像技術[66]。盡管超聲檢查在肝癌診斷方面的靈敏度低于 MRI 與 CT,但超聲檢查具有操作方便、直觀靈活、無創及檢查費用低廉等優勢[67],因此超聲檢查依舊是肝癌篩查中最常用的影像檢查手段。本研究發現單獨超聲篩查 Sen合并 僅為 0.65[95%CI(0.62,0.69)],Spe合并 為 0.97[95%CI(0.96,0.97)],且超聲檢查易受到檢查醫師的手法、經驗以及細致程度的影響,故單獨采用超聲檢查敏感性較低且穩定性不佳,我們認為其不能單獨作為肝癌篩查的技術方法。
早期篩查與診斷對于肝癌的有效治療和改善預后轉歸尤為重要,目前臨床常以影像學技術結合生物標志物檢測的方法診斷肝癌[68]。本研究發現 AFP 20 ng/mL 與肝臟超聲聯合篩查肝癌的 Sen合并 為 0.96[95%CI(0.94,0.98)],Spe合并 為 0.96[95%CI(0.96,0.96)],綜合考慮敏感度與特異度,AFP 與肝臟超聲聯合篩查技術的診斷效能更高;基于中國人群的研究結果同樣表明甲胎蛋白 20 ng/mL 與肝臟超聲聯合篩查能顯著提升篩查靈敏度與特異度,準確性更佳。但原發性肝癌診療規范[69]認為血清 AFP 高于 400 ng/mL 時結合影像學特征時可對肝癌作出臨床診斷,故建議當血清 AFP 高于 20 ng/mL 時需要密切隨訪。
本研究局限性:① 基于血清甲胎蛋白與肝臟超聲聯合篩查技術的納入文獻量偏少,結果有待進一步研究進行驗證;② 盡管本研究進行了廣泛檢索,納入文獻較多,但以中文文獻居多,可能存在語言的發表偏倚;③ 部分納入研究的病例選擇標準不清楚,提示可能會存在病例選擇偏倚。
綜上所述,建議對高危人群每半年進行一次血清甲胎蛋白和肝臟超聲檢查,并考慮以 AFP 20 ng/mL 聯合肝臟超聲篩查作為原發性肝癌篩查標準,對肝癌進行篩查和早期監測。