引用本文: 馬弟娃, 牛小東, 田宏亮, 王文濤, 盧先明, 蘇海霞, 姜雷. 血清胃蛋白酶原用于亞洲胃癌高危人群篩查價值的Meta分析. 中國循證醫學雜志, 2015, 15(2): 176-180. doi: 10.7507/1672-2531.20150031 復制
近年來胃癌的發病率在逐年下降,但仍是世界范圍內十分常見的惡性腫瘤之一 [1]。研究數據顯示,全世界每年因胃癌致死的病例數為73.8萬,約占癌癥死亡人數的9.7%,同時胃癌每年新發病例數約為98.9萬,約占癌癥新發病例的7.8% [2]。東亞地區如日本、中國是胃癌的高發地區。2009年中國胃癌發病率為36.21/10萬,占全部腫瘤的12.67%,全國胃癌死亡率為25.88/10萬,占全部腫瘤的14.33% [3]。
對高危人群的篩查是胃癌早診早治的重要手段。其作為胃癌的常規檢查方式,患者檢查時所受痛苦大,技術含量高且費用昂貴,因而不宜作為篩查的手段。已有大量研究發現血清胃蛋白酶原(pensinogen,PG)PGⅠ及PGⅠ/PG Ⅱ比值下降在胃癌篩查中具有重要意義,被稱之為血清學胃活檢 [4]。同時通過血清PG篩查胃癌能夠克服胃鏡檢查痛苦大、技術含量和費用高的弊端,已得到了廣泛應用。
近十年來開展以血清胃蛋白酶原(PG)檢測來初篩胃癌高危人群,再以胃鏡精查的二步普查法取得了一定的成果 [5]。血清胃蛋白酶原作為胃癌的篩查指標,其準確性在各研究中差異較大(敏感度14.6%~76.5%、特異度為41.9%~97.3%)。為此,本研究收集近十年國內外已發表的、有關亞洲地區血清胃蛋白酶原篩查胃癌的診斷性試驗,采用Meta分析客觀評價胃蛋白酶原對胃癌篩查的準確性,以期為今后廣泛開展血清PG篩查胃癌提供決策依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
近十年國內外公開發表的關于血清胃蛋白酶原水平檢測胃癌的診斷性試驗。文種限中、英文。
1.1.2 研究對象
① 研究人群為亞洲地區常住居民;② 能夠提取完整四格表數據的診斷性試驗。
1.1.3 診斷方法
待評價試驗將血清PGⅠ/PG Ⅱ比值和(或)PGⅠ水平作為評價胃癌的指標,且給出明確診斷臨界值;以胃鏡取活組織或X線鋇餐檢查結果為金標準。
1.1.4 結局指標
敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(-LR)、診斷比值比(DOR)以及受試者工作特征(SROC)曲線下面積(AUC)。
1.1.5 排除標準
① 會議摘要;② 測量指標不明確者;③ 重復發表的文獻;④ 研究對象為已確診的胃癌病人;⑤ 血清PG聯合其他檢測指標如幽門螺桿菌等評價胃癌的診斷性試驗。
1.2 檢索策略
計算機檢索PubMed、EMbase、The Cochrane Library(2013年第12期)、CNKI、WanFang Data、VIP和CBM,查找有關亞洲地區血清胃蛋白酶原篩查胃癌的診斷性試驗,檢索時限為2004年1月至2014年1月。同時手工檢索相關專業期刊,并追溯納入文獻的參考文獻。
采用主題詞、關鍵詞進行檢索。中文檢索詞包括血清、胃蛋白酶原、胃癌、胃惡性腫瘤;英文檢索詞包括serum、pensinogen、gastric cancer、stomach cancer、stomach neoplasms、gastric neoplasms。以CNKI為例,其具體檢索策略見框1。
框 1 CNKI檢索策略
#1 血清 #2 胃蛋白酶原 #3 胃癌 OR 胃惡性腫瘤 #4 #1 AND #2 AND #3
1.3 文獻篩選、資料提取與質量評價
由2位評價員按照納入與排除標準獨立篩選文獻、提取資料和方法學質量評價。如遇分歧則討論解決或交由第三方協助裁定。
采用數據提取表提取資料,提取內容主要包括:① 納入研究的基本信息,包括研究題目、第一作者、發表雜志及時間等;② 研究設計類型及質量評價的關鍵要素;③ 患者基本情況,包括納入例數、性別比例、年齡等;④ 干預措施:檢測方法等;⑤ 結局指標:TP、FP、FN、TN等。
然后對納入研究進行質量評價,采用評價診斷性研究質量的QUADAS工具 [6]評價納入文獻質量,每一條目以“是”、“否”、“不清楚”評價,“是”為滿足此標準,“否”為不滿足此標準,部分滿足或者從文章中無法得到足夠的信息為“不清楚”。
1.4 統計分析
采用Meta-DiSc 1.4軟件 [7]進行Meta分析。通過ROC曲線平面圖和計算靈敏度對數與(1-特異度)對數的Spearman相關系數來檢驗有無閾值效應,若平面圖呈“肩臂狀”分布,和/或Spearman相關系數P值<0.05,提示存在閾值效應。如存在閾值效應,則數據合并的最佳方式是擬合SROC曲線并計算曲線下面積(AUC),或應用其他統計量如Q*指數。若無閾值效應,則計算其合并的Sen、Spe、+LR、 -LR、DOR,并繪制SROC曲線,計算AUC。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 447篇,經逐層篩選后,最終納入15個研究 [5, 8-21],其中13個研究 [5, 8-21]的金標準為病理診斷,2個研究 [17, 21]的金標準為X線鋇餐診斷。共180 934例接受胃蛋白酶原的篩查,共79 064例接受了金標準檢測(其中61 735例接受病理檢測,17 329例接受X線鋇餐檢測)。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征與質量評價


2.3 Meta分析結果
ROC曲線平面圖提示呈“肩臂狀”分布(圖 2),進一步計算Spearman相關系數=0.752,P=0.001,提示存在閾值效應,則數據合并的最佳方式是擬合SROC曲線并計算AUC。結果顯示,SROC AUC=0.74(圖 3)。


3 討論
PG有Ⅰ、Ⅱ兩個亞群,PGⅠ主要由胃底腺的主細胞和頸黏液細胞分泌,PGⅡ除上述細胞分泌外還來源于幽門腺及十二指腸腺 [22]。大部分PG進入胃腔,但也有少量透過胃黏膜毛細血管進入血液中,故可以從血清中檢測。由于胃幾乎是PG的唯一來源,所以其變化能夠反映出胃黏膜形態和功能變化 [23],可作為胃癌的篩查指標。本研究通過Meta分析探討PG在篩查胃癌高危人群中的價值。
本研究的樣本量為180 934例,Meta分析結果顯示SROC AUC=0.74。AUC越大(越接近1)則診斷價值越大,表明血清胃蛋白酶原對于亞洲地區常住居民胃癌篩查有較好的價值。又因血清PG篩查方便快捷、創傷小且價格便宜,所以血清PG是篩查胃癌比較好的手段。
Dinis-Ribeiro等 [24]在2004年對42篇關于血清PG對胃癌診斷的原始研究進行了系統評價,總樣本量為300 938例,結果發現選擇不同的臨界值,Sen、Spe、+LR與-LR之間存在較大的差異,其中最理想的臨界值為PGⅠ<70 ng/mL且PGⅠ/PGⅡ<3.0,其Sen為77.3%,Spe為73.2%。同時他們發現在不同的地區,最佳臨界值也不一致,如在西方國家最佳臨界值應為PGⅠ<30 ng/mL且PGⅠ/PGⅡ<2.0。不同的人群最佳臨界值也不一致。所以原始研究所選擇的人群、地區、臨界值、檢測方法以及金標準等對血清胃蛋白酶原對胃癌篩查價值的判斷存在較大影響。本次Meta分析納入研究在臨界值、檢測方法等方面均存在較大差異,從而導致Meta分析的結果并不是非常理想。但在一定程度上可說明血清PG對胃癌有一定的診斷價值。
當然,本系統評價也存在一定的局限性:① 僅納入中、英文文獻,可能存在一定程度的選擇性偏倚;② 納入研究的測量儀器之間有所不同,可能會因為儀器的改進更新和系統誤差而影響到測量結果;③ 納入原始研究的質量參差不齊,可能影響結論的可靠性。④ 因納入文獻數量有限,未使用QUADAS評分進行Meta回歸分析。此外,我們無法探究研究設計,包括盲法、隨機設計及前瞻性設計是否影響診斷的準確性。
綜上所述,PG在一定程度上有助于胃癌的診斷,但診斷價值并不令人十分滿意。若要給臨床應用提供更加科學客觀的參考依據,需要更多的研究者進行設計嚴謹、樣本量大、多中心的診斷性研究,采納統一的檢測方法與嚴格的質控措施,以減少偏倚,保證研究質量,得出可信度高、指導意義強的研究結果,為胃癌高危人群的篩查提供更安全、經濟、便捷和準確的手段。
近年來胃癌的發病率在逐年下降,但仍是世界范圍內十分常見的惡性腫瘤之一 [1]。研究數據顯示,全世界每年因胃癌致死的病例數為73.8萬,約占癌癥死亡人數的9.7%,同時胃癌每年新發病例數約為98.9萬,約占癌癥新發病例的7.8% [2]。東亞地區如日本、中國是胃癌的高發地區。2009年中國胃癌發病率為36.21/10萬,占全部腫瘤的12.67%,全國胃癌死亡率為25.88/10萬,占全部腫瘤的14.33% [3]。
對高危人群的篩查是胃癌早診早治的重要手段。其作為胃癌的常規檢查方式,患者檢查時所受痛苦大,技術含量高且費用昂貴,因而不宜作為篩查的手段。已有大量研究發現血清胃蛋白酶原(pensinogen,PG)PGⅠ及PGⅠ/PG Ⅱ比值下降在胃癌篩查中具有重要意義,被稱之為血清學胃活檢 [4]。同時通過血清PG篩查胃癌能夠克服胃鏡檢查痛苦大、技術含量和費用高的弊端,已得到了廣泛應用。
近十年來開展以血清胃蛋白酶原(PG)檢測來初篩胃癌高危人群,再以胃鏡精查的二步普查法取得了一定的成果 [5]。血清胃蛋白酶原作為胃癌的篩查指標,其準確性在各研究中差異較大(敏感度14.6%~76.5%、特異度為41.9%~97.3%)。為此,本研究收集近十年國內外已發表的、有關亞洲地區血清胃蛋白酶原篩查胃癌的診斷性試驗,采用Meta分析客觀評價胃蛋白酶原對胃癌篩查的準確性,以期為今后廣泛開展血清PG篩查胃癌提供決策依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
近十年國內外公開發表的關于血清胃蛋白酶原水平檢測胃癌的診斷性試驗。文種限中、英文。
1.1.2 研究對象
① 研究人群為亞洲地區常住居民;② 能夠提取完整四格表數據的診斷性試驗。
1.1.3 診斷方法
待評價試驗將血清PGⅠ/PG Ⅱ比值和(或)PGⅠ水平作為評價胃癌的指標,且給出明確診斷臨界值;以胃鏡取活組織或X線鋇餐檢查結果為金標準。
1.1.4 結局指標
敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(-LR)、診斷比值比(DOR)以及受試者工作特征(SROC)曲線下面積(AUC)。
1.1.5 排除標準
① 會議摘要;② 測量指標不明確者;③ 重復發表的文獻;④ 研究對象為已確診的胃癌病人;⑤ 血清PG聯合其他檢測指標如幽門螺桿菌等評價胃癌的診斷性試驗。
1.2 檢索策略
計算機檢索PubMed、EMbase、The Cochrane Library(2013年第12期)、CNKI、WanFang Data、VIP和CBM,查找有關亞洲地區血清胃蛋白酶原篩查胃癌的診斷性試驗,檢索時限為2004年1月至2014年1月。同時手工檢索相關專業期刊,并追溯納入文獻的參考文獻。
采用主題詞、關鍵詞進行檢索。中文檢索詞包括血清、胃蛋白酶原、胃癌、胃惡性腫瘤;英文檢索詞包括serum、pensinogen、gastric cancer、stomach cancer、stomach neoplasms、gastric neoplasms。以CNKI為例,其具體檢索策略見框1。
框 1 CNKI檢索策略
#1 血清 #2 胃蛋白酶原 #3 胃癌 OR 胃惡性腫瘤 #4 #1 AND #2 AND #3
1.3 文獻篩選、資料提取與質量評價
由2位評價員按照納入與排除標準獨立篩選文獻、提取資料和方法學質量評價。如遇分歧則討論解決或交由第三方協助裁定。
采用數據提取表提取資料,提取內容主要包括:① 納入研究的基本信息,包括研究題目、第一作者、發表雜志及時間等;② 研究設計類型及質量評價的關鍵要素;③ 患者基本情況,包括納入例數、性別比例、年齡等;④ 干預措施:檢測方法等;⑤ 結局指標:TP、FP、FN、TN等。
然后對納入研究進行質量評價,采用評價診斷性研究質量的QUADAS工具 [6]評價納入文獻質量,每一條目以“是”、“否”、“不清楚”評價,“是”為滿足此標準,“否”為不滿足此標準,部分滿足或者從文章中無法得到足夠的信息為“不清楚”。
1.4 統計分析
采用Meta-DiSc 1.4軟件 [7]進行Meta分析。通過ROC曲線平面圖和計算靈敏度對數與(1-特異度)對數的Spearman相關系數來檢驗有無閾值效應,若平面圖呈“肩臂狀”分布,和/或Spearman相關系數P值<0.05,提示存在閾值效應。如存在閾值效應,則數據合并的最佳方式是擬合SROC曲線并計算曲線下面積(AUC),或應用其他統計量如Q*指數。若無閾值效應,則計算其合并的Sen、Spe、+LR、 -LR、DOR,并繪制SROC曲線,計算AUC。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 447篇,經逐層篩選后,最終納入15個研究 [5, 8-21],其中13個研究 [5, 8-21]的金標準為病理診斷,2個研究 [17, 21]的金標準為X線鋇餐診斷。共180 934例接受胃蛋白酶原的篩查,共79 064例接受了金標準檢測(其中61 735例接受病理檢測,17 329例接受X線鋇餐檢測)。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征與質量評價


2.3 Meta分析結果
ROC曲線平面圖提示呈“肩臂狀”分布(圖 2),進一步計算Spearman相關系數=0.752,P=0.001,提示存在閾值效應,則數據合并的最佳方式是擬合SROC曲線并計算AUC。結果顯示,SROC AUC=0.74(圖 3)。


3 討論
PG有Ⅰ、Ⅱ兩個亞群,PGⅠ主要由胃底腺的主細胞和頸黏液細胞分泌,PGⅡ除上述細胞分泌外還來源于幽門腺及十二指腸腺 [22]。大部分PG進入胃腔,但也有少量透過胃黏膜毛細血管進入血液中,故可以從血清中檢測。由于胃幾乎是PG的唯一來源,所以其變化能夠反映出胃黏膜形態和功能變化 [23],可作為胃癌的篩查指標。本研究通過Meta分析探討PG在篩查胃癌高危人群中的價值。
本研究的樣本量為180 934例,Meta分析結果顯示SROC AUC=0.74。AUC越大(越接近1)則診斷價值越大,表明血清胃蛋白酶原對于亞洲地區常住居民胃癌篩查有較好的價值。又因血清PG篩查方便快捷、創傷小且價格便宜,所以血清PG是篩查胃癌比較好的手段。
Dinis-Ribeiro等 [24]在2004年對42篇關于血清PG對胃癌診斷的原始研究進行了系統評價,總樣本量為300 938例,結果發現選擇不同的臨界值,Sen、Spe、+LR與-LR之間存在較大的差異,其中最理想的臨界值為PGⅠ<70 ng/mL且PGⅠ/PGⅡ<3.0,其Sen為77.3%,Spe為73.2%。同時他們發現在不同的地區,最佳臨界值也不一致,如在西方國家最佳臨界值應為PGⅠ<30 ng/mL且PGⅠ/PGⅡ<2.0。不同的人群最佳臨界值也不一致。所以原始研究所選擇的人群、地區、臨界值、檢測方法以及金標準等對血清胃蛋白酶原對胃癌篩查價值的判斷存在較大影響。本次Meta分析納入研究在臨界值、檢測方法等方面均存在較大差異,從而導致Meta分析的結果并不是非常理想。但在一定程度上可說明血清PG對胃癌有一定的診斷價值。
當然,本系統評價也存在一定的局限性:① 僅納入中、英文文獻,可能存在一定程度的選擇性偏倚;② 納入研究的測量儀器之間有所不同,可能會因為儀器的改進更新和系統誤差而影響到測量結果;③ 納入原始研究的質量參差不齊,可能影響結論的可靠性。④ 因納入文獻數量有限,未使用QUADAS評分進行Meta回歸分析。此外,我們無法探究研究設計,包括盲法、隨機設計及前瞻性設計是否影響診斷的準確性。
綜上所述,PG在一定程度上有助于胃癌的診斷,但診斷價值并不令人十分滿意。若要給臨床應用提供更加科學客觀的參考依據,需要更多的研究者進行設計嚴謹、樣本量大、多中心的診斷性研究,采納統一的檢測方法與嚴格的質控措施,以減少偏倚,保證研究質量,得出可信度高、指導意義強的研究結果,為胃癌高危人群的篩查提供更安全、經濟、便捷和準確的手段。