引用本文: 米雪, 李佳蓮, 陳敏, 曾力楠, 黃宗瑤, 宋好鑫, 張伶俐. 藥物經濟學系統評價的再評價. 中國循證醫學雜志, 2019, 19(2): 212-217. doi: 10.7507/1672-2531.201808144 復制
面對日益增長的衛生需求,如何更高效地配置有限的醫藥衛生資源已成為衛生決策者面臨的巨大挑戰[1-4]。藥物經濟學研究作為衛生經濟學研究的分支,已被越來越多運用于醫療保健決策[5-7]。許多國際機構(如 National Institute for Health and Care Excellence、Pharmaceutical Benefits Advisory Committee、Canadian Agency for Drugs and Technologies in Health 等)在制作衛生技術評估(HTA)時,要求采用相關經濟學研究系統評價的結果來輔助進行公共衛生評估和政策制定[8-11]。但由于經濟學系統評價(pharm-SR)目前尚無世界公認的方法學標準,其存在報告不透明情況,導致 pharm-SR 的質量參差不齊[12, 13]。本研究旨在對 pharm-SR 的發表情況和方法學質量進行再評價,以期為今后的 pharm-SR 相關研究提供參考。
1 資料與方法
1.1 納入與排除標準
納入標準:① 人群類型:明確疾病種類的患者或者健康人群;② 干預措施/對照措施:明確的藥物干預,用于疾病的預防、治療、診斷等各方面;③ 研究類型:經濟學系統評價或含有經濟學系統評價的衛生技術評估。
排除標準:① 非中英文文獻;② 重復發表的文獻;③ 討論疾病負擔的經濟學系統評價;④ 無法獲取全文的文獻,如會議摘要;⑤ 冠以系統評價的質量評價研究或一般綜述;⑥ 藥物與非藥物比較的系統評價。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase(Ovid)、NHS EED(Ovid)、CENTRAL、The Cochrane Library、Health Technology Assessment(HTA) Database、CNKI、WanFang Data、VIP 和 CBM,搜集 pharm-SR,檢索時限均為建庫至 2018 年 5 月 6 日。采用主題詞和自由詞相結合的檢索方式,并根據具體數據庫進行調整。英文檢索詞為:cost-benefit analysis、cost utility analysis、cost effectiveness analysis、cost analysis economic evaluation、review literature、systematic review。中文檢索詞為:經濟學、成本效果、成本效益、成本效用、系統評價。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和數據提取
按照預先設定的納入與排除標準,由 2 名研究員獨立進行文獻篩選和數據提取,并交叉核對,如遇分歧則討論解決,缺乏的資料盡量與作者聯系予以補充。資料提取主要內容包括:作者、發表年份、發表國家、發表期刊、研究對象和疾病、檢索資源、納入原始研究數、納入文獻質量評估工具、結果分析方法、方法學質量評價的關鍵要素等。
1.4 納入研究的方法學質量評價
因目前經濟學研究尚無定量合成的方法來進行 Meta 分析,同時 Cochrane Handbook 和 CRD 指南也推薦對納入的經濟學研究結果進行描述性總結,而非定量合并[14, 15]。故本研究也僅對納入 pharm-SR 結果進行描述性分析。
為更好地評價 pharm-SR 的方法學質量,本研究通過專家咨詢對 AMSTAR 量表[6]進行了改良,刪除了條目 10“是否對發表偏倚進行評估”,將條目 9 改為“被用來描述研究結果的方法是否恰當”。改良后的 AMSTAR 量表共 10 個條目,每個條目分別用“是”、“否”、“無法回答”進行描述。改良后的 AMSTAR 量表共 10 分,設定 0~4 分為低質量,5~8 分為中等質量,9~10 分為高質量。
1.5 統計分析
采用 Microsoft Excel 2013 軟件錄入數據并對納入文獻基本特征包括發表期刊類型及影響因子、疾病類型、納入研究的方法學質量評價方法等進行數據統計和頻數分析。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 11 577 篇,剔重后獲得 9 367 篇,經 2 位研究員獨立篩選,最終納入 143 篇文獻(中文 19 篇,英文 124 篇)。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
2.2.1 發表年份和國家
自 2000 年起首篇 pharm-SR 發表后[16],其作者來自 5 大洲 19 個國家。其中,英國和中國兩國所發表文獻占總文獻量的 64.8%。中國于 2005 年開始發表 pharm-SR,2005 年共發表 2 篇[17, 18],其中 1 篇發表于《中國循證醫學雜志》,1 篇為學位論文。2000~2018 年以來發表的 pharm-SR 數量總體呈上升趨勢。各國發表 pharm-SR 文獻數量情況見圖 2。

2.2.2 發表期刊
納入的 143 篇文獻發表于 54 種期刊,其中發文量最多的期刊分別是 Health Technology Assessment 和 Pharmacoeconomics,分別占總發文量的 38.5% 和 13.3%。其他雜志的發文量均不超過 3 篇。在 54 種期刊中,SCI 期刊 33 種(61.1%),非 SCI 期刊 21 種(38.9%)。33 種 SCI 期刊影響因子(IF)范圍為 1.483~7.483,均值為 3.994±1.049,最低影響因子雜志為 Journal of Evaluation in Clinical Practice,IF 為 1.483,最高影響因子雜志為 Clinical Gastroenterology and Hepatology,IF 為 7.483。英國發表的 SCI 論文最多,其中 92.98% 發表在 Health Technology Assessment 上。結果見圖 2。
2.2.3 研究疾病類型
143 篇文獻共涉及 19 種疾病類型,各疾病類別和發表文獻數量如圖 3 所示。pharm-SR 研究的主要關注方向為腫瘤(21.0%),其次是傳染病和寄生蟲病(14.3%)。

2.3 納入研究的文獻檢索和方法學質量評價方法
2.3.1 數據庫
每篇已發表文獻平均檢索 7.42±4.00 個數據庫。143 篇文獻共涉及檢索 114 個數據庫,其中普通數據庫 93 個(80.70%),經濟學相關數據庫 21 個(19.30%)。被檢索次數居前 3 位的普通數據庫依次為 MEDLINE(81.11%)、EMbase(74.83%)、The Cochrane Library(66.43%)。被檢索次數居前 5 位的經濟學相關數據庫依次為 Cochrane NHS EED (NHS economic evaluation database)(60.14%)、HTAD(Health Technology Assessment database)(49.65%)、EconLit(15.40%)、HEED(the Health Economic Evaluations Database)(12.59%)、NHS CRD EED(the National Health Service Economic Evaluation database)(10.49%)。這說明制作 pharm-SR 除檢索常規的普通數據庫外,還需檢索經濟學相關數據庫。
2.3.2 質量評價工具及分析方法
143 篇 pharm-SR 共使用 22 種藥物經濟學研究的質量評價工具,使用頻率較高的質量評價工具有 the British Medical Journal (BMJ) checklist(20.15%)、the Drummond checklist(19.40%)、The Consolidated Health Economic Evaluation Reporting Standards (CHEERS) statement (2013)(11.19%)。此外,有 15 篇(11.2%)研究采用已發表的質量評價工具進行改良,其中,使用較為頻繁的改良質量評價工具為 the Drummond checklist(41.38%)、the BMJ checklist(17.24%)、the CHEC list(6.90%)和 the Philips checklist(6.90%)。納入的 143 篇文獻均使用定性研究方法對結果進行綜合分析。
2.4 藥物經濟學系統評價的方法學質量評價
改良的 AMATAR 量表評價結果顯示,文獻得分范圍為 2~10 分,平均分為 6.89±2.28 分,總體方法學質量中等。其中,低質量文獻 25 篇(17.48%),中等質量文獻 76 篇(53.15%),高質量文獻 42 篇(29.37%)。條目的平均符合率為 67.34%,其中有 5 個條目被評定為報告較為完整(≥70%),分別為條目 3(88.11%)、條目 4(74.83%)、條目 6(93.71%)、條目 7(94.41%)、條目 9(78.32%)。結果見圖 4。

3 討論
pharm-SR 發表數量在逐年上升,涉及的地域、期刊、疾病類別等較為廣泛,表明越來越多的研究者開始關注 pharm-SR。其中,多數文章發表在 SCI 期刊上,以 Health Technology Assessment 和 Pharmacoeconomics 為主,pharm-SR 關注的研究疾病方向主要是腫瘤、傳染病和寄生蟲病。從檢索的數據庫、選取質量評價工具和結果分析方法來看,pharm-SR 的研究方法趨于統一和集中,有利于方法規范。pharm-SR 檢索的普通數據庫主要為 MEDLINE、EMbase 和 The Cochrane Library 數據庫,專業數據庫主要為 NHS EED、HTAD、EconLit、HEED 和 NHS CRD EED 等。值得注意的是,pharm-SR 檢索 CEA registry 的頻率僅占 3.73%,這顯示藥物經濟學注冊網站知名度及系統評價對灰色文獻的搜集有待提高。
在對納入文獻的質量評價方面,無論是直接使用,還是對已有質量評價工具進行改良,使用參考頻率最高的工具仍是 the Drummond checklist 和 the BMJ checklist。The Drummond checklist 出自專著《衛生保健項目經濟學評估方法》,先后已進行了 4 次更新,全面系統地介紹了經濟學評價的原理、概念、方法、應用,在國際上有廣泛的影響,是衛生與健康領域經濟學評價的重要指南[19, 20]。為提升在 BMJ 上發表的經濟學研究質量,BMJ 經濟學研究工作團隊(the BMJ Economic Evaluation Working Party)于 1996 年發表了 The BMJ checklist。雖然多年來一直未有更新,但在經濟學研究領域一直發揮著巨大的作用[21]。
我們采用改良后的 AMSTAR 量表對納入的 143 篇文獻進行方法學質量評價,方法學質量中等及以上的文獻為 118 篇(82.52%),AMSTAR 條目總體符合程度較好。但依然存在以下的方法學問題,主要體現在:① 沒有提供前期研究設計方案;本研究納入 143 篇文獻中僅有 50 篇(35%)提供了注冊號,其余文獻均未提及。而預注冊可以避免重復研究和減少系統評價/Meta 分析選擇性結果報告的偏倚,是一種有前途且有可能顯著改善系統評價質量的措施,值得研究者關注。② 納入文獻中僅 30% 的文獻提供了排除文獻清單,而納文獻均出現在參考文獻中。雖然由于版面限制,紙質期刊一般不會將排除文獻的清單列于文章之后,但是,為了研究的科學嚴謹性,筆者認為期刊編輯或評審專家應在審稿時索要排除文獻清單,并在文章發表后提供排除文獻清單的網絡鏈接以供讀者查看。③ 在納入研究的選擇和數據提取的可重復性方面,近 40% 的研究仍需進一步完善方法學部分以保證科學性和嚴謹性,如提供詳細的數據庫檢索策略、采用雙人交叉核對提取數據等。④ 有 55% 的系統評價在利益關系和沖突的報告中存在缺陷,有可能影響結果的客觀性;未來的研究需說明相關利益沖突,清楚交代系統評價及納入研究中潛在的資助來源。
pharm-SR 的研究方法和干預性研究的系統評價有相似之處,但也有其特殊性。除上述文獻檢索數據庫及質量評價工具選擇的不同之外,在數據提取方面,pharm-SR 更加關注經濟學結局指標,采用定性分析方法呈現結果。在報告規范方面,干預性研究的系統評價多遵從 PRISMA 量表報告條目,而 pharm-SR 尚無統一的報告規范。
本研究的局限性:① 未納入灰色文獻,研究限制語種為中文和英文,可能存在一定程度的發表偏倚;② 未檢索國外的學位論文數據庫,可能低估藥學服務經濟學研究系統評價的作用。
綜上所述,pharm-SR 研究數量在逐年遞增,且研究方法逐漸趨于統一和集中,但文獻方法學仍有待進一步的提高和完善,以期提供更高質量證據等級的文獻,有效運用循證手段為科學研究提供指導。
面對日益增長的衛生需求,如何更高效地配置有限的醫藥衛生資源已成為衛生決策者面臨的巨大挑戰[1-4]。藥物經濟學研究作為衛生經濟學研究的分支,已被越來越多運用于醫療保健決策[5-7]。許多國際機構(如 National Institute for Health and Care Excellence、Pharmaceutical Benefits Advisory Committee、Canadian Agency for Drugs and Technologies in Health 等)在制作衛生技術評估(HTA)時,要求采用相關經濟學研究系統評價的結果來輔助進行公共衛生評估和政策制定[8-11]。但由于經濟學系統評價(pharm-SR)目前尚無世界公認的方法學標準,其存在報告不透明情況,導致 pharm-SR 的質量參差不齊[12, 13]。本研究旨在對 pharm-SR 的發表情況和方法學質量進行再評價,以期為今后的 pharm-SR 相關研究提供參考。
1 資料與方法
1.1 納入與排除標準
納入標準:① 人群類型:明確疾病種類的患者或者健康人群;② 干預措施/對照措施:明確的藥物干預,用于疾病的預防、治療、診斷等各方面;③ 研究類型:經濟學系統評價或含有經濟學系統評價的衛生技術評估。
排除標準:① 非中英文文獻;② 重復發表的文獻;③ 討論疾病負擔的經濟學系統評價;④ 無法獲取全文的文獻,如會議摘要;⑤ 冠以系統評價的質量評價研究或一般綜述;⑥ 藥物與非藥物比較的系統評價。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase(Ovid)、NHS EED(Ovid)、CENTRAL、The Cochrane Library、Health Technology Assessment(HTA) Database、CNKI、WanFang Data、VIP 和 CBM,搜集 pharm-SR,檢索時限均為建庫至 2018 年 5 月 6 日。采用主題詞和自由詞相結合的檢索方式,并根據具體數據庫進行調整。英文檢索詞為:cost-benefit analysis、cost utility analysis、cost effectiveness analysis、cost analysis economic evaluation、review literature、systematic review。中文檢索詞為:經濟學、成本效果、成本效益、成本效用、系統評價。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和數據提取
按照預先設定的納入與排除標準,由 2 名研究員獨立進行文獻篩選和數據提取,并交叉核對,如遇分歧則討論解決,缺乏的資料盡量與作者聯系予以補充。資料提取主要內容包括:作者、發表年份、發表國家、發表期刊、研究對象和疾病、檢索資源、納入原始研究數、納入文獻質量評估工具、結果分析方法、方法學質量評價的關鍵要素等。
1.4 納入研究的方法學質量評價
因目前經濟學研究尚無定量合成的方法來進行 Meta 分析,同時 Cochrane Handbook 和 CRD 指南也推薦對納入的經濟學研究結果進行描述性總結,而非定量合并[14, 15]。故本研究也僅對納入 pharm-SR 結果進行描述性分析。
為更好地評價 pharm-SR 的方法學質量,本研究通過專家咨詢對 AMSTAR 量表[6]進行了改良,刪除了條目 10“是否對發表偏倚進行評估”,將條目 9 改為“被用來描述研究結果的方法是否恰當”。改良后的 AMSTAR 量表共 10 個條目,每個條目分別用“是”、“否”、“無法回答”進行描述。改良后的 AMSTAR 量表共 10 分,設定 0~4 分為低質量,5~8 分為中等質量,9~10 分為高質量。
1.5 統計分析
采用 Microsoft Excel 2013 軟件錄入數據并對納入文獻基本特征包括發表期刊類型及影響因子、疾病類型、納入研究的方法學質量評價方法等進行數據統計和頻數分析。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 11 577 篇,剔重后獲得 9 367 篇,經 2 位研究員獨立篩選,最終納入 143 篇文獻(中文 19 篇,英文 124 篇)。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
2.2.1 發表年份和國家
自 2000 年起首篇 pharm-SR 發表后[16],其作者來自 5 大洲 19 個國家。其中,英國和中國兩國所發表文獻占總文獻量的 64.8%。中國于 2005 年開始發表 pharm-SR,2005 年共發表 2 篇[17, 18],其中 1 篇發表于《中國循證醫學雜志》,1 篇為學位論文。2000~2018 年以來發表的 pharm-SR 數量總體呈上升趨勢。各國發表 pharm-SR 文獻數量情況見圖 2。

2.2.2 發表期刊
納入的 143 篇文獻發表于 54 種期刊,其中發文量最多的期刊分別是 Health Technology Assessment 和 Pharmacoeconomics,分別占總發文量的 38.5% 和 13.3%。其他雜志的發文量均不超過 3 篇。在 54 種期刊中,SCI 期刊 33 種(61.1%),非 SCI 期刊 21 種(38.9%)。33 種 SCI 期刊影響因子(IF)范圍為 1.483~7.483,均值為 3.994±1.049,最低影響因子雜志為 Journal of Evaluation in Clinical Practice,IF 為 1.483,最高影響因子雜志為 Clinical Gastroenterology and Hepatology,IF 為 7.483。英國發表的 SCI 論文最多,其中 92.98% 發表在 Health Technology Assessment 上。結果見圖 2。
2.2.3 研究疾病類型
143 篇文獻共涉及 19 種疾病類型,各疾病類別和發表文獻數量如圖 3 所示。pharm-SR 研究的主要關注方向為腫瘤(21.0%),其次是傳染病和寄生蟲病(14.3%)。

2.3 納入研究的文獻檢索和方法學質量評價方法
2.3.1 數據庫
每篇已發表文獻平均檢索 7.42±4.00 個數據庫。143 篇文獻共涉及檢索 114 個數據庫,其中普通數據庫 93 個(80.70%),經濟學相關數據庫 21 個(19.30%)。被檢索次數居前 3 位的普通數據庫依次為 MEDLINE(81.11%)、EMbase(74.83%)、The Cochrane Library(66.43%)。被檢索次數居前 5 位的經濟學相關數據庫依次為 Cochrane NHS EED (NHS economic evaluation database)(60.14%)、HTAD(Health Technology Assessment database)(49.65%)、EconLit(15.40%)、HEED(the Health Economic Evaluations Database)(12.59%)、NHS CRD EED(the National Health Service Economic Evaluation database)(10.49%)。這說明制作 pharm-SR 除檢索常規的普通數據庫外,還需檢索經濟學相關數據庫。
2.3.2 質量評價工具及分析方法
143 篇 pharm-SR 共使用 22 種藥物經濟學研究的質量評價工具,使用頻率較高的質量評價工具有 the British Medical Journal (BMJ) checklist(20.15%)、the Drummond checklist(19.40%)、The Consolidated Health Economic Evaluation Reporting Standards (CHEERS) statement (2013)(11.19%)。此外,有 15 篇(11.2%)研究采用已發表的質量評價工具進行改良,其中,使用較為頻繁的改良質量評價工具為 the Drummond checklist(41.38%)、the BMJ checklist(17.24%)、the CHEC list(6.90%)和 the Philips checklist(6.90%)。納入的 143 篇文獻均使用定性研究方法對結果進行綜合分析。
2.4 藥物經濟學系統評價的方法學質量評價
改良的 AMATAR 量表評價結果顯示,文獻得分范圍為 2~10 分,平均分為 6.89±2.28 分,總體方法學質量中等。其中,低質量文獻 25 篇(17.48%),中等質量文獻 76 篇(53.15%),高質量文獻 42 篇(29.37%)。條目的平均符合率為 67.34%,其中有 5 個條目被評定為報告較為完整(≥70%),分別為條目 3(88.11%)、條目 4(74.83%)、條目 6(93.71%)、條目 7(94.41%)、條目 9(78.32%)。結果見圖 4。

3 討論
pharm-SR 發表數量在逐年上升,涉及的地域、期刊、疾病類別等較為廣泛,表明越來越多的研究者開始關注 pharm-SR。其中,多數文章發表在 SCI 期刊上,以 Health Technology Assessment 和 Pharmacoeconomics 為主,pharm-SR 關注的研究疾病方向主要是腫瘤、傳染病和寄生蟲病。從檢索的數據庫、選取質量評價工具和結果分析方法來看,pharm-SR 的研究方法趨于統一和集中,有利于方法規范。pharm-SR 檢索的普通數據庫主要為 MEDLINE、EMbase 和 The Cochrane Library 數據庫,專業數據庫主要為 NHS EED、HTAD、EconLit、HEED 和 NHS CRD EED 等。值得注意的是,pharm-SR 檢索 CEA registry 的頻率僅占 3.73%,這顯示藥物經濟學注冊網站知名度及系統評價對灰色文獻的搜集有待提高。
在對納入文獻的質量評價方面,無論是直接使用,還是對已有質量評價工具進行改良,使用參考頻率最高的工具仍是 the Drummond checklist 和 the BMJ checklist。The Drummond checklist 出自專著《衛生保健項目經濟學評估方法》,先后已進行了 4 次更新,全面系統地介紹了經濟學評價的原理、概念、方法、應用,在國際上有廣泛的影響,是衛生與健康領域經濟學評價的重要指南[19, 20]。為提升在 BMJ 上發表的經濟學研究質量,BMJ 經濟學研究工作團隊(the BMJ Economic Evaluation Working Party)于 1996 年發表了 The BMJ checklist。雖然多年來一直未有更新,但在經濟學研究領域一直發揮著巨大的作用[21]。
我們采用改良后的 AMSTAR 量表對納入的 143 篇文獻進行方法學質量評價,方法學質量中等及以上的文獻為 118 篇(82.52%),AMSTAR 條目總體符合程度較好。但依然存在以下的方法學問題,主要體現在:① 沒有提供前期研究設計方案;本研究納入 143 篇文獻中僅有 50 篇(35%)提供了注冊號,其余文獻均未提及。而預注冊可以避免重復研究和減少系統評價/Meta 分析選擇性結果報告的偏倚,是一種有前途且有可能顯著改善系統評價質量的措施,值得研究者關注。② 納入文獻中僅 30% 的文獻提供了排除文獻清單,而納文獻均出現在參考文獻中。雖然由于版面限制,紙質期刊一般不會將排除文獻的清單列于文章之后,但是,為了研究的科學嚴謹性,筆者認為期刊編輯或評審專家應在審稿時索要排除文獻清單,并在文章發表后提供排除文獻清單的網絡鏈接以供讀者查看。③ 在納入研究的選擇和數據提取的可重復性方面,近 40% 的研究仍需進一步完善方法學部分以保證科學性和嚴謹性,如提供詳細的數據庫檢索策略、采用雙人交叉核對提取數據等。④ 有 55% 的系統評價在利益關系和沖突的報告中存在缺陷,有可能影響結果的客觀性;未來的研究需說明相關利益沖突,清楚交代系統評價及納入研究中潛在的資助來源。
pharm-SR 的研究方法和干預性研究的系統評價有相似之處,但也有其特殊性。除上述文獻檢索數據庫及質量評價工具選擇的不同之外,在數據提取方面,pharm-SR 更加關注經濟學結局指標,采用定性分析方法呈現結果。在報告規范方面,干預性研究的系統評價多遵從 PRISMA 量表報告條目,而 pharm-SR 尚無統一的報告規范。
本研究的局限性:① 未納入灰色文獻,研究限制語種為中文和英文,可能存在一定程度的發表偏倚;② 未檢索國外的學位論文數據庫,可能低估藥學服務經濟學研究系統評價的作用。
綜上所述,pharm-SR 研究數量在逐年遞增,且研究方法逐漸趨于統一和集中,但文獻方法學仍有待進一步的提高和完善,以期提供更高質量證據等級的文獻,有效運用循證手段為科學研究提供指導。