引用本文: 秦淑霞, 易利丹, 李斯妮, 吳美渝, 王李婷, 曾小慧, 譚重慶, 彭六保, 萬小敏. 胃癌篩查衛生經濟學評價的系統評價. 中國循證醫學雜志, 2022, 22(7): 812-821. doi: 10.7507/1672-2531.202201007 復制
胃癌是我國第三大常見癌癥,國際癌癥研究機構數據顯示,2020年全球胃癌發病人數約108萬人,死亡病例約76萬人,其中43.9%的胃癌新發病例和48.6%的胃癌死亡病例發生在中國[1-3]。我國診斷的胃癌病例約90%處于進展期,此時即使接受了外科手術治療,5年生存率也不足30%[4]。胃癌已成為嚴重威脅我國居民健康、影響國家經濟和社會可持續發展的重大公共衛生問題之一。
癌癥預防和篩查是目前公認的癌癥防控最有效的途徑[5]。檢測并根除被列為人類胃癌第Ⅰ類致癌物的幽門螺桿菌(helicobacter pylori,Hp)是預防胃癌的主要方法[6-7]。有研究發現89%的非賁門癌可歸因于Hp感染[8-10],經Hp根除治療患者的胃癌發病率是未根除者的0.55倍[11]。篩查能夠提高癌癥早期診斷率和治愈率,是有效降低癌癥死亡率的關鍵手段[5,12]。在日本和韓國,內鏡篩查可使胃癌死亡率分別降低30%和47%[13-14]。檢測并根除Hp和內鏡篩查可分別降低胃癌發病率和死亡率,對改善我國當前嚴峻胃癌防控形勢有重大意義。然而,由于衛生資源的有限性,一系列胃癌篩查措施能否作為一項基本衛生政策在我國大規模普及,還需要判斷其成本-效果收益。因此,本研究系統評價國內外胃癌篩查的衛生經濟學評價研究現狀,以研究內容、研究方法、模型建立等方面為重點進行探討,以期為我國胃癌篩查措施的實施及未來衛生經濟學評價研究提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
衛生經濟學評價研究。
1.1.2 研究對象
成年人,其他不限。
1.1.3 干預措施
胃癌篩查。
1.1.4 結局指標
① 成本;② 效果;③ 增量成本-效果比(incremental cost-effectiveness ratio,ICER)。
1.1.5 排除標準
① 非中、英文文獻;② 重復發表的文獻;③ 無法獲取全文的文獻;④ 內容不完整,如僅進行成本測算或缺乏結局指標數據的研究。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、The Cochrane Library、Web of Science、CNKI、WanFang Data和VIP數據庫,搜集關于胃癌篩查的衛生經濟學評價研究。檢索時限均為1975年1月1日至2021年9月30日。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。英文檢索詞包括:stomach cancer、screening、cost-effectiveness、cost-utility、cost-benefit、economic evaluation等;中文檢索詞包括:胃癌、篩查、衛生經濟學、成本-效果分析、成本-效用分析、成本-效益分析、最小成本分析等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 基本信息:第一作者、發表年份等;② 研究人群:國別、性別、年齡;③ 研究內容:胃癌篩查的方案和方法;④ 研究方法:衛生經濟學評價方法、模型類型、是否基于自然歷史、是否校準模型;⑤ 研究結果與結論。
1.4 納入研究的偏倚風險評價
由2名研究者獨立評價納入研究的偏倚風險,并交叉核對結果。偏倚風險評價采用Drummond等[15]關于衛生經濟學研究評價的10條清單。
1.5 統計分析
采用Excel 2016軟件進行匯總。從研究內容、研究方法等方面進行描述性分析,對比每個研究間的異同,從衛生經濟學評價角度進行定性分析。
2 結果
2.1 文獻篩選流程與結果
初檢共獲得相關文獻698篇,經逐層篩選后,最終納入胃癌篩查相關的衛生經濟學評價44篇[16-59]。文獻篩選流程與結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征和偏倚風險評價結果
納入研究的基本特征見表1,納入研究的偏倚風險評價結果見表2。


2.3 定性分析結果
分析結果見表1。
2.3.1 研究人群
約21%的研究基于中國人群,其次是日本、美國和新加坡。多數研究針對高危人群,篩查對象年齡最小為15歲,約54%的研究目標人群年齡范圍在40~64歲。
2.3.2 研究內容
在篩查方法方面,主要針對內鏡、Hp檢測、影像學、血清胃蛋白酶原(pepsinogen,PG)等方法進行了評價。涉及到Hp檢測的研究數量最多,約占47%,其次是內鏡篩查,僅7.4%的研究涉及血清PG篩查方法。
對于篩查方案,納入研究主要評估了三種類型的方案:評價單個篩查方法、對比評價多個篩查方法、評價同一篩查方法的不同實施方案。其中,約47%的研究評價了單個篩查方法的經濟性。在評價同一篩查方法的不同實施方案的研究中,有3個研究[46,52,56]評價了篩查年齡,6個研究[46,52-56]評價了篩查間隔。
2.3.3 研究方法
在評價方法方面,絕大多數研究進行了成本-效用分析評價,有2個研究[44-45]使用的是最小成本分析的評價方法。在模型的構建方面,有9個研究未建立模型,僅基于人群數據進行衛生經濟學評價。共有35個研究建立了經濟學評價模型,其中,有65.2%的研究使用了Markov模型。在建立模型的研究中,有6個研究基于癌癥自然歷史構建模型,僅有4個研究對構建的模型進行了校準,校準所針對的目標人群經驗數據分別來自美國、日本和中國。
2.3.4 研究結果與結論
在健康產出指標方面,27個研究使用了質量調整生命年(quality adjusted life year,QALY)作為主要產出結局指標。此外,有21個研究還分析了篩查手段對胃癌發病例數、胃癌死亡例數的影響。
在納入的研究中,對Hp感染情況進行檢測的手段主要有血清Hp抗體檢測、尿素呼氣試驗(urea breath test,UBT)、糞便抗原試驗(stool antigen test,SAT),2個研究認為SAT法進行Hp篩查的成本-效果比UBT法好[34-35]。有4個研究結果顯示,內鏡篩查比影像學篩查更具有成本-效果[44-47]。在評估內鏡篩查實施方案的研究中,有3個研究發現,在50歲時進行內鏡篩查的方案最具有成本-效果[46,52,56]。
3 討論
胃癌發病情況的地區分布差異較大,每年全球胃癌新發病例中,東亞地區(中國、日本、韓國)占65%[2,60]。目前只有日本和韓國有較全面的胃癌篩查系統[61],分別計劃為50歲、40歲以上的個體提供內鏡篩查[62-63],我國專家共識認為年齡在40歲以上是胃癌篩查目標人群的必要條件[64]。本研究發現,多數研究針對胃癌高發地區高危人群,有助于篩查效果最大化。此外,超一半的研究評估40~64歲人群的篩查效果,這與胃癌高發年齡段40~50歲接近。
幾乎所有納入研究均表明,進行胃癌篩查可挽救更多胃癌相關死亡,且具有成本-效果。但不同的篩查措施間比較的結果不盡相同,這與檢測技術的性能相關,當篩查措施的靈敏度、特異度較低時,篩查效果和成本-效果均會下降。
除公認的胃癌致病因素Hp,吸煙行為也與胃癌的發生密切相關。有研究發現,Hp感染可使胃癌發生風險增加6倍,吸煙能使其增加2倍[65-66]。多地區胃癌流行病學研究表明,無論是否感染Hp,吸煙都是胃癌的重要危險因素[67]。1個Meta分析發現吸煙將導致男性和女性的胃癌風險分別增加50%和20%[68]。在胃癌篩查的衛生經濟學模型中,除了Hp,吸煙行為的影響也有必要考慮在內,這可使模型更符合真實情況。但本研究發現,在納入的35個建立了經濟學模型的研究中,僅3個研究考慮了吸煙對胃癌發病率的影響[39,52-53]。
Hp感染的檢測方法有很多種,主要有血清Hp抗體檢測和UBT。血清Hp抗體檢測便宜且依從性較高,是亞太地區基于人群篩查的最佳選擇[69]。但由于其敏感性和特異性較低,建議與其他篩查方法聯合使用。UBT是臨床最常用的Hp檢測方法,具有靈敏度和特異度較高、不受Hp在胃內灶性分布影響等優點[70]。血清PG檢測可反映胃體、胃竇黏膜外分泌功能,被稱為“血清學活檢”[71-72]。血清胃泌素-17(gastrin-17,G-17)可反映胃竇黏膜萎縮或異常增生的情況[64],有研究表明,G-17聯合PG檢測可提高胃癌診斷的價值[73-74]。內鏡是對胃黏膜進行直接目視檢查的唯一方法,是診斷胃癌的金標準[75]。但內鏡檢查費用相對較高且有一定痛苦,導致患者依從性較差。此外,普通內鏡對于進展期胃癌檢出率高,但較難發現早期胃癌[64]。
納入研究中有近50%的研究僅評價了單個篩查措施,還有部分研究僅對比了不同篩查技術的經濟性。然而,篩查開始年齡、停止年齡、時間間隔等因素的改變,會生成多種篩查方案,何種具體篩查方案最適合我國胃癌高危人群且具有成本-效果,還有待更深入的研究。
根據Correa級聯反應原理,胃癌進展過程包括胃炎、萎縮、腸化生、異常增生、胃癌共5種病變狀態[76]。構建經濟學模型時,基于胃癌自然史考慮多個癌前病變狀態及其相互進展,能夠使胃癌篩查模型更接近真實情況。在納入的研究中,僅6個研究基于胃癌自然歷史構建模型,而我國的胃癌篩查模型幾乎沒有基于胃癌自然史建立。
胃癌自然史中的臨床表現率等參數通常無法直接觀測,在衛生經濟學評價中,常通過校準獲得模型中不可觀測的參數值[77]。國際上大多數癌癥篩查的衛生經濟學評價研究均建立了癌癥自然史模型并進行校準。挪威乳腺癌篩查的衛生經濟學評價研究基于乳腺癌自然史建模,并針對最新的經驗數據進行校準[78]。在納入的研究中,3個針對美國和日本人群的研究對模型進行了校準,使得模型模擬的癌癥進展與當地人群特征相符,從而使模型的真實性和可靠性得到了提升。
目前,我國尚無基于校準模型對胃癌篩查進行衛生經濟學評價的研究,僅有1個研究針對中國胃癌高發地區臨朐縣人群建立了校準模型[18],但其校準目標為2002年之前的流行病學數據。隨著醫療技術的發展和生活條件的改善,近年來胃癌的患病率和發病率有所改善,但目前尚無基于我國最新胃癌流行病學數據的校準模型,且多數模型的參數來源于國外人群的研究,這些參數本質上與中國人群特征不符,會削弱模型的可靠性和科學性。
綜上所述,我國胃癌篩查衛生經濟學評價研究還存在模型未考慮吸煙的影響、未進行模型校準、評價的方案較局限等問題。
胃癌是我國第三大常見癌癥,國際癌癥研究機構數據顯示,2020年全球胃癌發病人數約108萬人,死亡病例約76萬人,其中43.9%的胃癌新發病例和48.6%的胃癌死亡病例發生在中國[1-3]。我國診斷的胃癌病例約90%處于進展期,此時即使接受了外科手術治療,5年生存率也不足30%[4]。胃癌已成為嚴重威脅我國居民健康、影響國家經濟和社會可持續發展的重大公共衛生問題之一。
癌癥預防和篩查是目前公認的癌癥防控最有效的途徑[5]。檢測并根除被列為人類胃癌第Ⅰ類致癌物的幽門螺桿菌(helicobacter pylori,Hp)是預防胃癌的主要方法[6-7]。有研究發現89%的非賁門癌可歸因于Hp感染[8-10],經Hp根除治療患者的胃癌發病率是未根除者的0.55倍[11]。篩查能夠提高癌癥早期診斷率和治愈率,是有效降低癌癥死亡率的關鍵手段[5,12]。在日本和韓國,內鏡篩查可使胃癌死亡率分別降低30%和47%[13-14]。檢測并根除Hp和內鏡篩查可分別降低胃癌發病率和死亡率,對改善我國當前嚴峻胃癌防控形勢有重大意義。然而,由于衛生資源的有限性,一系列胃癌篩查措施能否作為一項基本衛生政策在我國大規模普及,還需要判斷其成本-效果收益。因此,本研究系統評價國內外胃癌篩查的衛生經濟學評價研究現狀,以研究內容、研究方法、模型建立等方面為重點進行探討,以期為我國胃癌篩查措施的實施及未來衛生經濟學評價研究提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
衛生經濟學評價研究。
1.1.2 研究對象
成年人,其他不限。
1.1.3 干預措施
胃癌篩查。
1.1.4 結局指標
① 成本;② 效果;③ 增量成本-效果比(incremental cost-effectiveness ratio,ICER)。
1.1.5 排除標準
① 非中、英文文獻;② 重復發表的文獻;③ 無法獲取全文的文獻;④ 內容不完整,如僅進行成本測算或缺乏結局指標數據的研究。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、The Cochrane Library、Web of Science、CNKI、WanFang Data和VIP數據庫,搜集關于胃癌篩查的衛生經濟學評價研究。檢索時限均為1975年1月1日至2021年9月30日。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。英文檢索詞包括:stomach cancer、screening、cost-effectiveness、cost-utility、cost-benefit、economic evaluation等;中文檢索詞包括:胃癌、篩查、衛生經濟學、成本-效果分析、成本-效用分析、成本-效益分析、最小成本分析等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 基本信息:第一作者、發表年份等;② 研究人群:國別、性別、年齡;③ 研究內容:胃癌篩查的方案和方法;④ 研究方法:衛生經濟學評價方法、模型類型、是否基于自然歷史、是否校準模型;⑤ 研究結果與結論。
1.4 納入研究的偏倚風險評價
由2名研究者獨立評價納入研究的偏倚風險,并交叉核對結果。偏倚風險評價采用Drummond等[15]關于衛生經濟學研究評價的10條清單。
1.5 統計分析
采用Excel 2016軟件進行匯總。從研究內容、研究方法等方面進行描述性分析,對比每個研究間的異同,從衛生經濟學評價角度進行定性分析。
2 結果
2.1 文獻篩選流程與結果
初檢共獲得相關文獻698篇,經逐層篩選后,最終納入胃癌篩查相關的衛生經濟學評價44篇[16-59]。文獻篩選流程與結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征和偏倚風險評價結果
納入研究的基本特征見表1,納入研究的偏倚風險評價結果見表2。


2.3 定性分析結果
分析結果見表1。
2.3.1 研究人群
約21%的研究基于中國人群,其次是日本、美國和新加坡。多數研究針對高危人群,篩查對象年齡最小為15歲,約54%的研究目標人群年齡范圍在40~64歲。
2.3.2 研究內容
在篩查方法方面,主要針對內鏡、Hp檢測、影像學、血清胃蛋白酶原(pepsinogen,PG)等方法進行了評價。涉及到Hp檢測的研究數量最多,約占47%,其次是內鏡篩查,僅7.4%的研究涉及血清PG篩查方法。
對于篩查方案,納入研究主要評估了三種類型的方案:評價單個篩查方法、對比評價多個篩查方法、評價同一篩查方法的不同實施方案。其中,約47%的研究評價了單個篩查方法的經濟性。在評價同一篩查方法的不同實施方案的研究中,有3個研究[46,52,56]評價了篩查年齡,6個研究[46,52-56]評價了篩查間隔。
2.3.3 研究方法
在評價方法方面,絕大多數研究進行了成本-效用分析評價,有2個研究[44-45]使用的是最小成本分析的評價方法。在模型的構建方面,有9個研究未建立模型,僅基于人群數據進行衛生經濟學評價。共有35個研究建立了經濟學評價模型,其中,有65.2%的研究使用了Markov模型。在建立模型的研究中,有6個研究基于癌癥自然歷史構建模型,僅有4個研究對構建的模型進行了校準,校準所針對的目標人群經驗數據分別來自美國、日本和中國。
2.3.4 研究結果與結論
在健康產出指標方面,27個研究使用了質量調整生命年(quality adjusted life year,QALY)作為主要產出結局指標。此外,有21個研究還分析了篩查手段對胃癌發病例數、胃癌死亡例數的影響。
在納入的研究中,對Hp感染情況進行檢測的手段主要有血清Hp抗體檢測、尿素呼氣試驗(urea breath test,UBT)、糞便抗原試驗(stool antigen test,SAT),2個研究認為SAT法進行Hp篩查的成本-效果比UBT法好[34-35]。有4個研究結果顯示,內鏡篩查比影像學篩查更具有成本-效果[44-47]。在評估內鏡篩查實施方案的研究中,有3個研究發現,在50歲時進行內鏡篩查的方案最具有成本-效果[46,52,56]。
3 討論
胃癌發病情況的地區分布差異較大,每年全球胃癌新發病例中,東亞地區(中國、日本、韓國)占65%[2,60]。目前只有日本和韓國有較全面的胃癌篩查系統[61],分別計劃為50歲、40歲以上的個體提供內鏡篩查[62-63],我國專家共識認為年齡在40歲以上是胃癌篩查目標人群的必要條件[64]。本研究發現,多數研究針對胃癌高發地區高危人群,有助于篩查效果最大化。此外,超一半的研究評估40~64歲人群的篩查效果,這與胃癌高發年齡段40~50歲接近。
幾乎所有納入研究均表明,進行胃癌篩查可挽救更多胃癌相關死亡,且具有成本-效果。但不同的篩查措施間比較的結果不盡相同,這與檢測技術的性能相關,當篩查措施的靈敏度、特異度較低時,篩查效果和成本-效果均會下降。
除公認的胃癌致病因素Hp,吸煙行為也與胃癌的發生密切相關。有研究發現,Hp感染可使胃癌發生風險增加6倍,吸煙能使其增加2倍[65-66]。多地區胃癌流行病學研究表明,無論是否感染Hp,吸煙都是胃癌的重要危險因素[67]。1個Meta分析發現吸煙將導致男性和女性的胃癌風險分別增加50%和20%[68]。在胃癌篩查的衛生經濟學模型中,除了Hp,吸煙行為的影響也有必要考慮在內,這可使模型更符合真實情況。但本研究發現,在納入的35個建立了經濟學模型的研究中,僅3個研究考慮了吸煙對胃癌發病率的影響[39,52-53]。
Hp感染的檢測方法有很多種,主要有血清Hp抗體檢測和UBT。血清Hp抗體檢測便宜且依從性較高,是亞太地區基于人群篩查的最佳選擇[69]。但由于其敏感性和特異性較低,建議與其他篩查方法聯合使用。UBT是臨床最常用的Hp檢測方法,具有靈敏度和特異度較高、不受Hp在胃內灶性分布影響等優點[70]。血清PG檢測可反映胃體、胃竇黏膜外分泌功能,被稱為“血清學活檢”[71-72]。血清胃泌素-17(gastrin-17,G-17)可反映胃竇黏膜萎縮或異常增生的情況[64],有研究表明,G-17聯合PG檢測可提高胃癌診斷的價值[73-74]。內鏡是對胃黏膜進行直接目視檢查的唯一方法,是診斷胃癌的金標準[75]。但內鏡檢查費用相對較高且有一定痛苦,導致患者依從性較差。此外,普通內鏡對于進展期胃癌檢出率高,但較難發現早期胃癌[64]。
納入研究中有近50%的研究僅評價了單個篩查措施,還有部分研究僅對比了不同篩查技術的經濟性。然而,篩查開始年齡、停止年齡、時間間隔等因素的改變,會生成多種篩查方案,何種具體篩查方案最適合我國胃癌高危人群且具有成本-效果,還有待更深入的研究。
根據Correa級聯反應原理,胃癌進展過程包括胃炎、萎縮、腸化生、異常增生、胃癌共5種病變狀態[76]。構建經濟學模型時,基于胃癌自然史考慮多個癌前病變狀態及其相互進展,能夠使胃癌篩查模型更接近真實情況。在納入的研究中,僅6個研究基于胃癌自然歷史構建模型,而我國的胃癌篩查模型幾乎沒有基于胃癌自然史建立。
胃癌自然史中的臨床表現率等參數通常無法直接觀測,在衛生經濟學評價中,常通過校準獲得模型中不可觀測的參數值[77]。國際上大多數癌癥篩查的衛生經濟學評價研究均建立了癌癥自然史模型并進行校準。挪威乳腺癌篩查的衛生經濟學評價研究基于乳腺癌自然史建模,并針對最新的經驗數據進行校準[78]。在納入的研究中,3個針對美國和日本人群的研究對模型進行了校準,使得模型模擬的癌癥進展與當地人群特征相符,從而使模型的真實性和可靠性得到了提升。
目前,我國尚無基于校準模型對胃癌篩查進行衛生經濟學評價的研究,僅有1個研究針對中國胃癌高發地區臨朐縣人群建立了校準模型[18],但其校準目標為2002年之前的流行病學數據。隨著醫療技術的發展和生活條件的改善,近年來胃癌的患病率和發病率有所改善,但目前尚無基于我國最新胃癌流行病學數據的校準模型,且多數模型的參數來源于國外人群的研究,這些參數本質上與中國人群特征不符,會削弱模型的可靠性和科學性。
綜上所述,我國胃癌篩查衛生經濟學評價研究還存在模型未考慮吸煙的影響、未進行模型校準、評價的方案較局限等問題。