引用本文: 德吉, 楊麗, 王一平. 脫-γ-羧基凝血酶原診斷原發性肝癌的系統評價. 中國循證醫學雜志, 2020, 20(7): 798-808. doi: 10.7507/1672-2531.201909033 復制
原發性肝癌(primary hepatocellular carcinoma,PHC)是全球發病率、致死率均較高的惡性腫瘤,其中中國發病人數占全球的 55%。PHC 發病率有逐年上升的趨勢[1]。PHC 起病隱匿,多數患者明確診斷時,已喪失了最佳的治療時機,5 年生存率不到 10%。但目前研究報告直徑小于 2 cm 的 PHC 5 年生存率接近 100%[1]。因此,早期診斷是改善 PHC 預后,拯救患者生命的關鍵[2]。PHC 的早期診斷主要依靠特異的血清腫瘤標志物和肝臟影像檢查。甲胎蛋白是臨床廣泛使用的 PHC 血清標志物,但其在其他腫瘤中也呈較高表達,故敏感性、特異性均不盡人意。近年有可能使用在早期 PHC 診斷的血清腫瘤標志物包括:甲胎蛋白異質體、α-L-巖藻糖苷酶、上皮特異性細胞黏附分子、鱗狀細胞癌抗原和脫-γ-羧基凝血酶原(des-γ-carboxy prothrombin,DCP,又稱 protein induced by vitamin K absence or antagonists-Ⅱ,PIVKA-Ⅱ)等。Liebman 等[3]最早于 1984 年發現 DCP 在有些 PHC 患者中升高。DCP 是 PHC 的腫瘤細胞分泌的一種異常凝血酶原,與正常的凝血酶原相比,其 γ-羧基谷氨酸結構中有一個或多個谷氨酸殘基不完全羧化為 γ-羧基谷氨酸,因而沒有凝血功能[4]。有研究報道 DCP 診斷 PHC 的敏感性和特異性分別達到 83% 和 96%[5]。迄今,已有較多 DCP 診斷 PHC 的相關研究,大多數是有關 DCP 診斷 PHC 的準確性,但這些研究樣本量小,PHC 診斷標準不同,研究質量各異,DCP 檢測方法及臨界值不一,因此有必要系統評價血清 DCP 診斷 PHC 的診斷價值,為臨床實踐提供證據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
國內外公開發表的血清 DCP 診斷 PHC 的診斷性試驗。
1.1.2 研究對象
研究對象為疑似肝癌患者,均使用血清 DCP 檢測且最終獲得明確診斷結果。性別、年齡、種族、國籍不限。
1.1.3 診斷方法
DCP 檢測方法不限。以病理學檢查或公認的影像學檢查為診斷 PHC 的金標準。
1.1.4 結局指標
合并敏感度(pooled sensitivity,Sen合并)、合并特異度(pooled specificity,Spe合并)、合并陽性似然比(pooled positive likelihood ratio,+LR合并)、合并陰性似然比(pooled negative likelihood ratio,?LR合并)、合并診斷比值比(pooled diagnosis odds ratio,DOR合并)和受試者工作特征曲線(SROC)下面積(area under the curve,AUC)。
1.1.5 排除標準
① 未描述肝癌的具體診斷標準或未經上述金標準診斷的文獻;② 無法直接或者間接獲得四格表數據或全文;③ 檢測標本為患者或對照人群的組織或其他體液者;④ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、The Cochrane Library、Medline(Ovid)、CNKI、VIP、WanFang Data 和 CBM 數據庫,搜集國內外公開發表的所有關于 DCP 診斷 PHC 的診斷性試驗,檢索時限均從建庫至 2018 年 12 月 31 日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:肝癌、PHC、肝腫瘤、異常凝血酶原、脫-γ-羧基凝血酶原、維生素 K 缺乏誘發的蛋白質、DCP、PIVKA-II 等;英文檢索詞包括:primary hepatocellular carcinoma、PHC、HCC、liver cancer、des-gammacarboxy prothrombin、des-γ-carboxy prothrombin、DCP、PIVKA-II、Protein induced by vitamin K absence 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入研究的基本特征,包括第一作者、發表年份、文種、研究國家、試驗例數、檢測方法、臨界值、金標準、病因、對照組構成等;② 偏倚風險評價的關鍵要素;③ 所關注的結局測量指標數據,如真陽性值、假陽性值、真陰性值、假陰性值等。
1.4 納入研究的偏倚風險評價
由 2 位研究者獨立采用 QUADAS-2[6]評價工具評價納入研究的偏倚風險。
1.5 統計分析
采用 RevMan 5.3 軟件和 Meta Disc 1.4 軟件進行 Meta 分析。采用I2指數來判斷異質性大小,若P>0.10 且I2<50% 表明研究間異質性不大,此時采用固定效應模型進行合并;若P≤0.10 且I2>50%,表明研究間異質性較大,采用隨機效應模型進行合并。根據金標準分別列出 DCP 診斷 PHC 的 2×2 四格表,計算合并敏感度、特異度、陽性似然比、陰性似然比和診斷比值比,同時繪制 SROC 曲線并計算曲線下面積,評價 DCP 試驗的診斷價值。然后根據研究對象的特點進行 Meta 回歸分析來尋找引起異質性的潛在因素,同時按 Deville 等[7]介紹的方法進行亞組分析。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 926 篇,經逐層篩選后,最終納入 50 篇文獻[8-57],包括 15 099 例患者,其中中文文獻 26 篇,英文文獻 24 篇。診斷金標準為病理組織學或公認的影像學檢查結果。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征與偏倚風險評價結果


2.3 Meta 分析結果
2.3.1 異質性檢驗
ROC 曲線平面散點圖不呈“肩臂”狀,Spearman相關系數ρ=0.112,P=0.439,說明敏感度對數及(1-特異度)對數呈負相關,不存在閾值效應。但 DOR 的森林圖及Q值發現,每一個研究的診斷比值比分布較為離散,且Q=304.29,P<0.000 1,表明存在非閾值效應引起的異質性,故采用隨機效應模型進行合并分析(圖 3)。

2.3.2 合并效應量
血清 DCP 診斷 PHC 的 Sen合并、Spe合并、+LR合并、?LR合并、DOR 和 AUC 分別為 0.69[95%CI(0.67,0.70)](圖 4)、0.89[95%CI(0.89,0.90)](圖 5)、7.35[95%CI(6.08,8.90)]、0.31[95%CI(0.27,0.35)]、26.63[95%CI(20.42,34.73)](圖 3)和 0.909 9(圖 6)。



2.3.3 Meta 回歸分析
針對研究國家、研究年限、檢測方法、對照組構成進行 Meta 回歸分析,結果顯示,研究時代不同為異質性的主要來源(表 2)。

2.3.4 亞組分析
結果發現研究年限在 2010~2018 年的 DOR(34.60)較 1988~2009 年的 DOR(18.34)高,對照組為慢性肝炎組的 DOR(23.59)較肝硬化組的 DOR(17.09)高,同時發現檢測方法為 ELISA(DOR=28.46)的亞組具有較高的診斷效能(表 3)。

3 討論
本研究采用診斷試驗的系統評價方法對 DCP 在 PHC 的診斷效能方面進行分析并尋找影響異質性的因素,共納入 50 篇文獻,15 099 例研究對象。Meta 分析結果顯示:血清 DCP 診斷 PHC 的合并敏感度及特異度分別為 69% 和 89%,說明漏診率和誤診率分別為 31% 和 11%,提示血清 DCP 識別非 PHC 的能力較高,但精確診斷 PHC 的能力相對較低。敏感度和特異度的最大聚合點的 SROC 曲線 Q 值均為 304.29,SROC 曲線下面積 AUC 為 0.909 9,表明 DCP 診斷 PHC 的總準確性較高。診斷比值比是試驗準確性的獨立指標,是用來說明某種試驗陽性結果的機會是陰性結果的倍數,反映診斷試驗的結果與疾病的聯系程度。本 Meta 分析中 DOR 值為 26.63,表明 DCP 診斷 PHC 具有較高的準確性。由于似然比相對于 SROC 曲線和 DOR 更具有臨床實用性,更易解釋結果,所以本研究中我們還匯總了陽性似然比(+LR)和陰性似然比(?LR)。+LR 越高,?LR 越小,說明試驗結果的診斷價值越高。本研究結果顯示,+LR 較高(7.35)和?LR 較低(0.31),即血清 DCP 在診斷 PHC 和排除 PHC 具有同樣的高效能。這些結果與 Gao 等[58]研究結果相似。
本研究顯示納入研究間存在非閾值效應引起的異質性,為探討異質性的來源,我們根據研究特點回歸分析了不同研究年限、不同研究國家、不同檢測方法和不同對照組的影響。結果發現不同研究年限為異質性的主要來源,且具有統計學差異。我們再進一步根據研究特點按 Deville 等[7]介紹的方法進行了亞組分析,發現研究年限在 2010~2018 年的研究比 1988~2009 年的具有更高的診斷效能,我們進一步分析推測可能與 DCP 檢測方法及檢測儀器等有關。近年,隨著生物技術的迅速發展,高科技化的檢驗設備及方法應運而生,使診斷敏感性及特異性也相應的提高。同時發現對照組為慢性肝炎組比肝硬化組具有較高的敏感性、特異度、陽性似然比、DOR 和較低的陰性似然比,分析可能與患者病程及疾病本身的特點有關。Kim 等[59]檢測肝癌、肝硬化及慢性肝炎患者血清中 DCP 濃度,結果發現血清 DCP 濃度在肝癌組(5420.3±3960.0 Mau/mL)較肝硬化組(26.3±7.2 Mau/mL)高,而與慢性肝炎組(16.1±2.0 Mau/mL)比較差異更顯著,這與本研究結果相似。這可能是肝癌細胞產生并釋放至血液中的 DCP 具有進一步刺激肝癌細胞生長和促進腫瘤微血管形成等作用,成為肝癌細胞自分泌與刺激生長通路的一部分。一些臨床資料顯示[29,60],DCP 表達水平與肝癌病人病灶大小、數量、浸潤程度以及肝內外轉移等有密切相關性。但本研究納入的文獻中缺乏相應數據,故未能納入本次的 Meta 分析。另外,也有研究者對異常凝血酶原診斷原發性肝癌的研究進行了系統評價[61-63],但是有些研究的年限較早,近幾年文獻未納入,有些研究納入文獻不全,或對照組較單一,臨床參考價值不大。
本系統評價存在一定的局限性:① 部分文獻未能提供完整的數據資料和研究實施情況,可能影響研究的真實性;② 本次納入的 50 篇文獻中,42 篇是回顧性研究,只有 8 篇是前瞻性研究,而回顧性研究可能存在高估或低估診斷效能,從而可能降低本次分析結果的可靠性;③ 因缺乏相應數據,無法進一步分析 DCP 表達與肝癌病因、病灶大小、腫瘤分期等之間的相關性;④ 雖然對納入研究進行亞組分析和敏感性分析,但納入研究間的異質性較高,結果有待于進一步研究。
綜上所述,本 Meta 分析結果提示 DCP 診斷 PHC 具有較高的診斷效能,尤其具有較高的特異度,有助于明確診斷。但受納入研究的數量和質量限制,上述結論尚需開展更多高質量研究予以驗證。
原發性肝癌(primary hepatocellular carcinoma,PHC)是全球發病率、致死率均較高的惡性腫瘤,其中中國發病人數占全球的 55%。PHC 發病率有逐年上升的趨勢[1]。PHC 起病隱匿,多數患者明確診斷時,已喪失了最佳的治療時機,5 年生存率不到 10%。但目前研究報告直徑小于 2 cm 的 PHC 5 年生存率接近 100%[1]。因此,早期診斷是改善 PHC 預后,拯救患者生命的關鍵[2]。PHC 的早期診斷主要依靠特異的血清腫瘤標志物和肝臟影像檢查。甲胎蛋白是臨床廣泛使用的 PHC 血清標志物,但其在其他腫瘤中也呈較高表達,故敏感性、特異性均不盡人意。近年有可能使用在早期 PHC 診斷的血清腫瘤標志物包括:甲胎蛋白異質體、α-L-巖藻糖苷酶、上皮特異性細胞黏附分子、鱗狀細胞癌抗原和脫-γ-羧基凝血酶原(des-γ-carboxy prothrombin,DCP,又稱 protein induced by vitamin K absence or antagonists-Ⅱ,PIVKA-Ⅱ)等。Liebman 等[3]最早于 1984 年發現 DCP 在有些 PHC 患者中升高。DCP 是 PHC 的腫瘤細胞分泌的一種異常凝血酶原,與正常的凝血酶原相比,其 γ-羧基谷氨酸結構中有一個或多個谷氨酸殘基不完全羧化為 γ-羧基谷氨酸,因而沒有凝血功能[4]。有研究報道 DCP 診斷 PHC 的敏感性和特異性分別達到 83% 和 96%[5]。迄今,已有較多 DCP 診斷 PHC 的相關研究,大多數是有關 DCP 診斷 PHC 的準確性,但這些研究樣本量小,PHC 診斷標準不同,研究質量各異,DCP 檢測方法及臨界值不一,因此有必要系統評價血清 DCP 診斷 PHC 的診斷價值,為臨床實踐提供證據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
國內外公開發表的血清 DCP 診斷 PHC 的診斷性試驗。
1.1.2 研究對象
研究對象為疑似肝癌患者,均使用血清 DCP 檢測且最終獲得明確診斷結果。性別、年齡、種族、國籍不限。
1.1.3 診斷方法
DCP 檢測方法不限。以病理學檢查或公認的影像學檢查為診斷 PHC 的金標準。
1.1.4 結局指標
合并敏感度(pooled sensitivity,Sen合并)、合并特異度(pooled specificity,Spe合并)、合并陽性似然比(pooled positive likelihood ratio,+LR合并)、合并陰性似然比(pooled negative likelihood ratio,?LR合并)、合并診斷比值比(pooled diagnosis odds ratio,DOR合并)和受試者工作特征曲線(SROC)下面積(area under the curve,AUC)。
1.1.5 排除標準
① 未描述肝癌的具體診斷標準或未經上述金標準診斷的文獻;② 無法直接或者間接獲得四格表數據或全文;③ 檢測標本為患者或對照人群的組織或其他體液者;④ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、The Cochrane Library、Medline(Ovid)、CNKI、VIP、WanFang Data 和 CBM 數據庫,搜集國內外公開發表的所有關于 DCP 診斷 PHC 的診斷性試驗,檢索時限均從建庫至 2018 年 12 月 31 日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:肝癌、PHC、肝腫瘤、異常凝血酶原、脫-γ-羧基凝血酶原、維生素 K 缺乏誘發的蛋白質、DCP、PIVKA-II 等;英文檢索詞包括:primary hepatocellular carcinoma、PHC、HCC、liver cancer、des-gammacarboxy prothrombin、des-γ-carboxy prothrombin、DCP、PIVKA-II、Protein induced by vitamin K absence 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入研究的基本特征,包括第一作者、發表年份、文種、研究國家、試驗例數、檢測方法、臨界值、金標準、病因、對照組構成等;② 偏倚風險評價的關鍵要素;③ 所關注的結局測量指標數據,如真陽性值、假陽性值、真陰性值、假陰性值等。
1.4 納入研究的偏倚風險評價
由 2 位研究者獨立采用 QUADAS-2[6]評價工具評價納入研究的偏倚風險。
1.5 統計分析
采用 RevMan 5.3 軟件和 Meta Disc 1.4 軟件進行 Meta 分析。采用I2指數來判斷異質性大小,若P>0.10 且I2<50% 表明研究間異質性不大,此時采用固定效應模型進行合并;若P≤0.10 且I2>50%,表明研究間異質性較大,采用隨機效應模型進行合并。根據金標準分別列出 DCP 診斷 PHC 的 2×2 四格表,計算合并敏感度、特異度、陽性似然比、陰性似然比和診斷比值比,同時繪制 SROC 曲線并計算曲線下面積,評價 DCP 試驗的診斷價值。然后根據研究對象的特點進行 Meta 回歸分析來尋找引起異質性的潛在因素,同時按 Deville 等[7]介紹的方法進行亞組分析。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 926 篇,經逐層篩選后,最終納入 50 篇文獻[8-57],包括 15 099 例患者,其中中文文獻 26 篇,英文文獻 24 篇。診斷金標準為病理組織學或公認的影像學檢查結果。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征與偏倚風險評價結果


2.3 Meta 分析結果
2.3.1 異質性檢驗
ROC 曲線平面散點圖不呈“肩臂”狀,Spearman相關系數ρ=0.112,P=0.439,說明敏感度對數及(1-特異度)對數呈負相關,不存在閾值效應。但 DOR 的森林圖及Q值發現,每一個研究的診斷比值比分布較為離散,且Q=304.29,P<0.000 1,表明存在非閾值效應引起的異質性,故采用隨機效應模型進行合并分析(圖 3)。

2.3.2 合并效應量
血清 DCP 診斷 PHC 的 Sen合并、Spe合并、+LR合并、?LR合并、DOR 和 AUC 分別為 0.69[95%CI(0.67,0.70)](圖 4)、0.89[95%CI(0.89,0.90)](圖 5)、7.35[95%CI(6.08,8.90)]、0.31[95%CI(0.27,0.35)]、26.63[95%CI(20.42,34.73)](圖 3)和 0.909 9(圖 6)。



2.3.3 Meta 回歸分析
針對研究國家、研究年限、檢測方法、對照組構成進行 Meta 回歸分析,結果顯示,研究時代不同為異質性的主要來源(表 2)。

2.3.4 亞組分析
結果發現研究年限在 2010~2018 年的 DOR(34.60)較 1988~2009 年的 DOR(18.34)高,對照組為慢性肝炎組的 DOR(23.59)較肝硬化組的 DOR(17.09)高,同時發現檢測方法為 ELISA(DOR=28.46)的亞組具有較高的診斷效能(表 3)。

3 討論
本研究采用診斷試驗的系統評價方法對 DCP 在 PHC 的診斷效能方面進行分析并尋找影響異質性的因素,共納入 50 篇文獻,15 099 例研究對象。Meta 分析結果顯示:血清 DCP 診斷 PHC 的合并敏感度及特異度分別為 69% 和 89%,說明漏診率和誤診率分別為 31% 和 11%,提示血清 DCP 識別非 PHC 的能力較高,但精確診斷 PHC 的能力相對較低。敏感度和特異度的最大聚合點的 SROC 曲線 Q 值均為 304.29,SROC 曲線下面積 AUC 為 0.909 9,表明 DCP 診斷 PHC 的總準確性較高。診斷比值比是試驗準確性的獨立指標,是用來說明某種試驗陽性結果的機會是陰性結果的倍數,反映診斷試驗的結果與疾病的聯系程度。本 Meta 分析中 DOR 值為 26.63,表明 DCP 診斷 PHC 具有較高的準確性。由于似然比相對于 SROC 曲線和 DOR 更具有臨床實用性,更易解釋結果,所以本研究中我們還匯總了陽性似然比(+LR)和陰性似然比(?LR)。+LR 越高,?LR 越小,說明試驗結果的診斷價值越高。本研究結果顯示,+LR 較高(7.35)和?LR 較低(0.31),即血清 DCP 在診斷 PHC 和排除 PHC 具有同樣的高效能。這些結果與 Gao 等[58]研究結果相似。
本研究顯示納入研究間存在非閾值效應引起的異質性,為探討異質性的來源,我們根據研究特點回歸分析了不同研究年限、不同研究國家、不同檢測方法和不同對照組的影響。結果發現不同研究年限為異質性的主要來源,且具有統計學差異。我們再進一步根據研究特點按 Deville 等[7]介紹的方法進行了亞組分析,發現研究年限在 2010~2018 年的研究比 1988~2009 年的具有更高的診斷效能,我們進一步分析推測可能與 DCP 檢測方法及檢測儀器等有關。近年,隨著生物技術的迅速發展,高科技化的檢驗設備及方法應運而生,使診斷敏感性及特異性也相應的提高。同時發現對照組為慢性肝炎組比肝硬化組具有較高的敏感性、特異度、陽性似然比、DOR 和較低的陰性似然比,分析可能與患者病程及疾病本身的特點有關。Kim 等[59]檢測肝癌、肝硬化及慢性肝炎患者血清中 DCP 濃度,結果發現血清 DCP 濃度在肝癌組(5420.3±3960.0 Mau/mL)較肝硬化組(26.3±7.2 Mau/mL)高,而與慢性肝炎組(16.1±2.0 Mau/mL)比較差異更顯著,這與本研究結果相似。這可能是肝癌細胞產生并釋放至血液中的 DCP 具有進一步刺激肝癌細胞生長和促進腫瘤微血管形成等作用,成為肝癌細胞自分泌與刺激生長通路的一部分。一些臨床資料顯示[29,60],DCP 表達水平與肝癌病人病灶大小、數量、浸潤程度以及肝內外轉移等有密切相關性。但本研究納入的文獻中缺乏相應數據,故未能納入本次的 Meta 分析。另外,也有研究者對異常凝血酶原診斷原發性肝癌的研究進行了系統評價[61-63],但是有些研究的年限較早,近幾年文獻未納入,有些研究納入文獻不全,或對照組較單一,臨床參考價值不大。
本系統評價存在一定的局限性:① 部分文獻未能提供完整的數據資料和研究實施情況,可能影響研究的真實性;② 本次納入的 50 篇文獻中,42 篇是回顧性研究,只有 8 篇是前瞻性研究,而回顧性研究可能存在高估或低估診斷效能,從而可能降低本次分析結果的可靠性;③ 因缺乏相應數據,無法進一步分析 DCP 表達與肝癌病因、病灶大小、腫瘤分期等之間的相關性;④ 雖然對納入研究進行亞組分析和敏感性分析,但納入研究間的異質性較高,結果有待于進一步研究。
綜上所述,本 Meta 分析結果提示 DCP 診斷 PHC 具有較高的診斷效能,尤其具有較高的特異度,有助于明確診斷。但受納入研究的數量和質量限制,上述結論尚需開展更多高質量研究予以驗證。