內容提要 ??本文是《PLoS Medicine》關于衛生系統知證政策指導三篇系列文章的第三篇,闡述了應如何將證據轉化為指導,以形成衛生系統政策,并促進臨床和公共衛生干預的實施。其要點如下:①評估不同類型研究證據是決定解決衛生系統問題的政策方案的關鍵;②鑒于許多衛生系統干預的復雜性,系統透明的評價方法尤為重要;③當前有不少好的工具可用于評價對支持政策制定各階段不同類型的研究證據的信心,其中評價關于效果的證據最多;④我們需要制定工具來幫助評價其他關鍵因素的系統評價證據,如政策方案對于利益相關者的可接受性、實施可行性及公平性;⑤還需要進一步研究全球衛生系統指導政策方案的制定、構建及呈現方法。
引用本文: LewinSimon, Bosch-CapblanchXavier, OliverSandy, AklElie A. , VistGunn E. , LavisJohn N. , GhersiDavina, R?ttingenJohn-Arne, SteinmannPeter, GulmezogluMetin, TugwellPeter, ElJardaliFadi, HainesAndy. 衛生系統知證政策指導:評估對研究證據的信心△. 中國循證醫學雜志, 2014, 14(7): 789-794. doi: 10.7507/1672-2531.20140132 復制
1 引言
衛生系統包括以促進、恢復或保持健康為目的的所有組織和個體,以及各種行動方案,見本文術語定義(框S1)。衛生系統干預則確定或改善衛生系統中的行政(如專業人員許可)、財政(如醫療保險機制)和供給(如保健提供者)管理,以及實施戰略(如改變衛生保健提供者行為的策略)。這些干預的重點在于憑借自身實力加強衛生系統,或為需求者提供符合成本效果的項目與技術(如藥物和疫苗)。衛生系統加強的決策(包括由政策制定者制定的推薦意見)需要干預效果的證據和多種其他證據。比如在評估可能的政策方案時,經濟學評價和對利益相關者觀點的定性研究的再評價就很重要(表S1),因為此類證據有助于分析以上方案的成本效果,并確定利益相關者所認可的方案。
框1 “評估對指導加強衛生系統決策的證據的
·?此類證據用戶在對證據的信心上,幾乎總是得出明確或不明確的結論。 ·?此類證據會有助于形成推薦意見,包括推薦強度。 ·?系統明確的方法有助于: ·?促進證據的嚴格評價 ·?避免偏倚 ·?明確實施問題 ·?解決利益相關者的分歧 ·?呈現關于證據和決策形成的信息,以及基于這些信息的推薦 ·?系統透明的方法對多種衛生系統干預的復雜性尤為重要。這些干預在以下方面可能比較復雜:離散但有效的組分的數量及其相互作用;干預針對的行為數量;干預針對的組織層面的數量;干預實施的靈活度與適合度;干預實施所需的技能水平;環境依賴程度[48, 49]。鑒于這些干預的復雜性,基于證據的背景相關性做出決定至關重要。 *來源:改編自[30]。
對衛生系統干預的各種現有證據的信心評估,是決定將其用于加強衛生系統的關鍵部分(框1)。作為衛生系統指導三篇系列文章[1, 2]的第三篇,本文旨在:
·?闡明目前可用于評價支持政策制定過程各個環節的不同類型證據的工具;
·?討論GRADE(推薦等級的評估、制訂與評價)用于評估對效果估計(即“證據質量”)的信心,并對衛生系統干預政策方案的推薦強度進行分級;
·?討論制定衛生系統干預政策方案的推薦意見時的重要因素。
本系列第一篇文章[1]舉例說明了通過制定指導以促進衛生系統問題決策的形成,并探究了其中的具體挑戰和可能的解決方案。第二篇文章[2]則從全球和國家兩個層面研究了指導制定與政策制定的聯系,以及政策制定影響因素的范圍。
這3篇文章都基于衛生系統指導制定工作組的討論(框2 [1, 2])。本文重點關注了GRADE方法,可對證據質量和推薦意見強度進行透明系統的分級[3]。
框?2?衛生系統指導制定工作組
·?WHO于2009年成立了衛生系統指導制定工作組,旨在改善對衛生系統指導需求的響應情況。 ·?工作組由20名成員組成,由WHO根據其在衛生系統研究及實施領域的專業遴選出。 ·?工作組通過大量面對面會議和虛擬會議,幫助和監督制定《衛生系統指導制定手冊》,并確定需要深入交流和討論的更多問題[39]。 ·?工作組建議對部分方法和工具進行調整用于衛生系統指導的制定,同時闡明這些方法在哪些方面存在重大差異。 ·?本文編寫組進一步考慮了討論中提出的問題,完成初稿并提交至工作組進行評審。 ·?經過工作組和外審人員的幾番評審,本文和本系列的其他兩篇文章[1, 2]最終定稿。
2 評價支持加強衛生系統的政策制定過程中所需證據的工具
高質量的系統評價[4]可用于獲取最佳可得證據,從而判斷各種政策方案的效果,并促進政策制定過程的其他重要步驟(表S1)。正如本系列第二篇文章所述[2],用戶需要具備一定的能力來評價與政策制定每個步驟相關的系統評價中的證據。例如,在定義問題及干預需求時,需要借助工具評估對“關注概念化問題不同方法的研究綜述”(如人們對問題的經驗的研究綜述)證據的信心[5];評估可能的政策方案時,需要工具評估對如“評價影響的研究(如對效果研究的系統評價)”的信心;在確定實施注意事項時,也需要工具來評估對“實施影響因素的系統評價”的信心。
現在,許多工具都可用于評估干預效果的單個研究的偏倚風險[6]和評價單個定性研究[7],也有工具可用于評價系統評價中證據的質量[6]。這些納入證據的質量還需得出有意義的結論。對評估對系統評價中證據的信心程度,需要與系統評價的質量(即可靠性)區別開來。我們已制定了評價系統評價和Meta分析的報告工具(如PRISMA清單[8])及其方法學質量或可靠性的工具(如SUPPORT工具[9]和AMSTAR [10])(表 1),而我們重點關注的工具則是那些用于評估系統評價結果信心的工具。

2.1 評估對政策方案效果的系統評價結果的信心
評估對系統評價結果信心的工具大多適用于效果證據的系統評價。GRADE方法就是其中之一,此外還有許多其他工具[11]。在GRADE方法中,系統評價的證據質量受納入研究的質量及許多其他因素影響(表S2)。GRADE方法有很多優勢(表S3),也為越來越多的國際組織所應用,包括世界衛生組織(WHO)、Cochrane協作網,以及多個指南制定機構[3](另見于http://www.gradeworkinggroup.org)。接下來,我們將討論GRADE方法在評價衛生系統干預的證據質量和推薦強度中的應用。
2.2 評估對問題(非效果)系統評價結果的信心
幫助評估對與政策制定過程相關的問題(非效果)的信心的工具正處于早期制定階段。此類問題包括利益相關者的價值觀和意愿,以及干預的可行性(表S1);而對其中的部分問題,定性研究的系統評價和地方證據可共同支持評估結果[12]。若系統評價是通過定性的方法理解問題本質,質量評價就是評價在不同背景下結果解釋的一致性。盡管單個定性研究的質量標準一般都會考慮每個研究的方法及其結果的可信度與詳細程度[7, 13, 14],但迄今為止對定性研究系統評價的質量評估工具卻并未考慮研究結果的可信度與詳細程度,表S4中則提出了可實現這一點的工具。
探究影響方案實施的因素的系統評價能會使用混合法綜合(即定性與定量證據的綜合),如研究現有計劃或政策中隱含的解釋性理論的現實主義綜合[15],或提供高度結構化的演繹法對已有模型或框架進行數據分析的框架綜合(如[16-18])。而質量評價的重點則在于對單個研究各結論的信心[19]。將證據作為一個整體進行分級,可將影響每個結論的研究數量和背景,以及得出結論的方法的恰當性(見文獻插圖[16])考慮在內。單個研究可能會支持某一理論或與之相悖,而多個研究則可共同加強這一理論。關于混合法系統評價綜合研究得出政策方案的利弊結論,至今尚無任何可用于評價其效果的工具。
另一重要問題是資源利用。現已有工具可用于評估經濟學研究系統評價的可靠性[20]。此外,GRADE方法提供了關于“如何將對資源利用的考慮整合到推薦中”的指導[21]。
3 GRADE方法用于評估對衛生系統干預效果估計的信心
GRADE方法明確地區分了兩個問題,即證據質量和推薦強度。而證據質量只是評價推薦強度時的多個考慮因素之一。
在系統評價中,GRADE將證據質量定義為對效果估計的信心;而在指南或指導中,GRADE將其定義為對支持某具體推薦意見的效果估計的信心;信心程度是連續變量,但在實際應用中,我們將其分為高、中、低、極低四個等級(表S5)。
衛生系統干預效果的證據帶來了很多挑戰,這反過來影響使用GRADE方法評價證據質量和形成推薦意見。第一,盡管試驗性研究(包括實用隨機試驗[22])可用于部分衛生系統干預,但對于其他干預措施(特別是關于行政和財政管理的干預),其證據可能主要源于觀察性研究,包括國家級或州級項目的評估[23, 24]。第二,衛生系統干預評估常使用整群設計,而這些研究設計的實施、分析及報告質量常常較差[25, 26]。第三,衛生系統干預傾向于測量替代結局,如服務或激勵措施的應用情況,證據用戶需要判斷是否有充分證據說明替代結局與期望的健康結局之間的關系。而制定結局框架來幫助評價干預(舉例見[27, 28])可有助于制定者判斷替代結局是否充分。最后,未能充分描述對衛生系統和政策系統因素以及實施注意事項時,可能難以做出符合背景的政策方案的推薦意見[29]。GRADE則致力于系統透明地對這些問題進行判斷。
4 形成衛生系統干預備選政策方案的推薦意見
從證據到備選方案推薦意見,需要解釋多種因素,而不僅僅是證據。多數情況下,我們需要評估這些因素的解釋,這突出了透明的重要性,特別是在推薦意見需要考慮多種復雜衛生系統干預時(且每種干預都有其相應的證據質量評價)。另一個挑戰是評估大量的衛生系統和政策系統因素——影響不同環境下對某一衛生系統問題的各種方案的選擇和實施(見本系列其他文章[1, 2])——所要面臨的其他復雜性。例如,一個衛生系統問題可能涉及很多利益相關者,而他們對現有方案卻各持己見;此外,衛生系統干預在不同環境下也可會有不同的系統效果。因此,相比臨床指南制定單一的推薦意見,衛生系統指導從證據出發,并列出大量適用于不同環境的方案,用于解決某個衛生系統問題可能更為有效。而這些方案反過來又可能需要在國家或次國家層面上得到協商或決策制定,詳見后文討論部分或本系列其他文章[2]。
GRADE等的工具有助于對方案的推薦強度進行分級[30, 31],也可用于衛生系統干預,但需明確納入其他影響因素(框3)才能發揮作用。探索這些因素的實用性需要進一步研究,但一般來說,任何指導推薦意見制定的工具都應通過清晰描述并解釋其影響因素來提高透明性,以促進推薦意見的形成。
框?3?影響決定政策方案推薦強度的可能因素
GRADE因素(改編自文獻[30]): ·?利弊平衡是否具有不確定性; ·?系統評價證據的質量(極低、低、中、高); ·?利益相關者的價值觀和意愿是否具有不確定性或差異性; ·?不確定成本或資源利用是否取得了應有的凈收益; ·?干預可行性(或影響證據轉化為實踐的地方因素,包括公平性問題)是否具有不確定性。 ? 可能有助于衛生系統干預考慮的其他因素: ·?在系統層面促進實施,包括行政管理(如規范的改變)、財政管理(如具體環境中方案與籌資模式的契合度)、實施策略(如向實施者或輔助者提供所需技能與經驗的方式)。 ·?社會政治注意事項(如聯系推薦方案與現有政策的方式),政策系統的價值標準(關于公平性或私有化等問題)以及經濟改革。
在GRADE方法中,推薦意見反映了對推薦方案應用效果利大于弊的信心程度。具體來說就是強推薦表示推薦意見的應用效果利大于弊,而有條件(或“有限制的”、“弱”)推薦則表示該推薦意見的應用效果可能利大于弊,具有不確定性。
GRADE試圖根據推薦意見所考慮的因素做出透明(通過文件記錄)和系統(對指南考慮的所有問題使用同一方法)的判斷。表 2、表S6、表S7說明了GRADE方法在衛生系統干預中的應用(分別包括供給管理、財政管理以及實施策略),并呈現了衛生系統干預指導如何描述多種適用于不同環境的政策方案(該方法有待于進一步研究)。和其他分級系統一樣,GRADE也沒有提供有關對證據“可接受性”或“可行性”信心程度評估的指導。按照慣例,這些決定都是通過指南小組共識得出的,小組需要包括具備指南問題相關的專業知識和經驗的個人。還需要進一步工作來制定此類證據質量評價的正式方法。

4.1 從評價證據質量到形成政策方案推薦的挑戰
從評價證據質量到形成政策方案的推薦意見會面臨很多挑戰。首先,評估推薦強度可能需要詳細了解證據的產生和評價過程,但這一過程并非總是可得。第二,將推薦意見分為“強”和“弱”兩級存在困難,比如制定全球指導的小組可能不愿做出“弱”推薦,因為政策制定者認為“弱推薦”就等于“沒有推薦”,故不會對此類推薦意見做出回應。第三,我們常用GRADE等工具評價兩種備選政策方案的證據質量,而很多衛生系統評價(實際上還有很多臨床決策)則包含多重干預,這增加了解釋和決策制定的復雜程度,使得透明性顯得更加重要。
如何應對這些挑戰呢?在制定并解釋系統評價以及應用GRADE等工具進行評估時需要方法學專業知識,因此衛生系統指導小組需要方法學家的支持。此外,還應將這些工具的輸出結果“轉化”成適當的語言及格式,以確保指導小組能夠正確理解并應用其結果。相關研究正在各類計劃中開展,如DECIDE(制定并評估交流策略以支持知證決策和循證實踐;http://www.decide-collaboration.eu)協作網就是關于向政策制定者呈現GRADE評價與政策方案信息的方法。
4.2 其他挑戰
在制定衛生系統干預政策方案的推薦意見時,還面臨著很多其他挑戰。首先是用于評價證據質量和形成推薦意見的工具需要能夠適用于各種評價衛生系統干預效果的研究類型,而GRADE就有可能實現這一點。其次,形成衛生系統干預的推薦意見,需制定出對其他類型證據(如關于可接受性的證據)的信心評估的工具[32]。
最后,國際標準制定組織(如WHO)必須做出適用于全球的推薦意見。但正如之前提到的,制定衛生系統問題的全球推薦并非易事,因為具體環境因素的重大變化會影響國家和次國家層面干預的適用性[2, 33]。我們在本系列第二篇中已提出了一種有助于聯系全球指導制定和國家政策制定的方法[2]。
當有必要在全球水平制定推薦意見時,那些正在制定的指導可能需要列出各種政策方案而非單個推薦意見。此類方案可能包括一個或多個問題,也可能基于與這些問題相關的系列干預。衛生與政策系統因素在與具體方案聯系起來時而被納入考慮,例如:這些方案可能會基于不同環境下開展的評估來描述干預內容及實施方法的變化。需要進一步來探究政策制定者如何理解并選擇全球指導中的政策方案。但向國家決策者提供工具來幫助他們做出適合于其所在環境的推薦意見才可能有效,而目前已有[33, 34]或正在制定多個這樣的工具(見http://www.decidecollaboration.eu/work-packages-strategies)。重要的是,在評價干預、背景和其他情況變化的影響時,全球指導應明確所需考慮的因素,而決策模型在探究這些變化的效果時可能有效(如[35, 36])。由于衛生系統問題的政策方案常只有低質量證據,因此很多情況下可能還需要評估推薦方案。
4.3 向指導小組和政策制定者呈現背景與實施問題的證據
提供衛生系統和政策系統相關的背景與實施問題的證據,可幫助指導小組和政策制定者判斷推薦強度,但目前最佳提供方式尚不明確。針對政策制定者的證據總結和效果系統評價結果總結表(Summary of findings,SOF)等相關研究指出,在制定有效且可理解的呈現方法時,其形式和內容同樣重要[37, 38]。《衛生系統指導制定手冊》提出了一種以用戶友好的證據文件形式向利益相關者呈現此類證據的方法[39];同樣,本系列文二中描述了更多的衛生與政策系統特點,我們可能需要對其進行評價以形成決策[2]。
若想要讓指導小組和政策制定者能夠使用證據來判斷推薦方案的強度,那么還需要更多的研究和試驗方法(包括可視化形式)呈現可得的證據,也要努力加強政策制定者使用證據進行決策的能力[2, 12, 40]。
5 結論
目前已有不少的工具可對衛生系統政策方案的證據質量和推薦強度進行分級,但仍有不少問題需要解決。首先,需要應用這些工具進行系統透明的判斷。第二,對很多衛生系統問題,證據質量可能較低。但這些領域需要更高質量的研究才能增加指導小組對證據的信心,以做出更強的推薦意見。第三,需要研究方法來制定、構建以及呈現全球衛生系統指導的備選政策方案。這些方案要包括衛生與政策系統因素和實施注意事項的證據,還要完善相應的證據評價工具。最后,需要更加關注如何將衛生系統干預指導應用到地方水平。
相關資料
其他語言的要點概述S1:西班牙語版要點概述(Xavier Bosch-Capblanch譯)(DOC)
其他語言的要點概述S2:法語版要點概述(Bruno Clary, William Lenoir, Lise Beck譯)(DOC)
其他語言的要點概述S3:葡萄牙語版要點概述(Bruno Viana譯)(DOC)
其他語言的要點概述S4:阿拉伯語版要點概述(Fadi El-Jardali譯)(DOC)
框S1:本文術語定義(PDF)
表S1:政策制定過程不同階段所需的系統評價類型,以及對這些系統評價證據進行信心評估的工具的可得性(PDF)
表S2:GRADE標準:評價效果系統評價中的每個重要結局的證據質量(PDF)
表S3:GRADE方法的優勢(PDF)
表S4:評估對定性研究系統評價結果的信心(PDF)
表S5:GRADE中證據質量分類的定義(PDF)
表S6:影響推薦意見強度決策的因素:以中低收入國家用戶費用的變化為例(PDF)
表S7:影響推薦強度決策的因素:以挽留鄉村衛生工作者的繼續教育項目為例(PDF)
致謝
我們對衛生系統指導制定工作組的其他成員(以及工作組成立時他們的工作單位)表示由衷的感謝,包括:Edgardo Abalos,羅薩里奧圍產期研究中心(阿根廷);Abdul Ghaffar,WHO衛生政策與體系研究聯盟(瑞士);Timothy Evans,WHO信息、證據及研究部門助理總干事(瑞士);Regina Kulier,WHO研究政策與合作司信息、證據及研究部門(瑞士);Pierre Ongolo Zogo,最佳衛生實踐制定中心,雅溫德中心醫院,雅溫德大學,雅溫德(喀麥隆);Tikki Pang,WHO研究政策與合作司信息、證據及研究部門(瑞士);Ulysses Panisset,WHO研究政策與合作司信息、證據及研究部門(瑞士)。
同時要感謝以下人員的用心付出:Claire Glenton和Andy Oxman,挪威衛生服務知識中心(挪威)。
作者貢獻
構思和設計試驗:SL,XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH;撰寫初稿:SL;參與文章撰寫:XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH;閱讀并滿足國際醫學雜志編輯委員會(ICMJE)著作權標準:SL,XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH;認同文章結果和結論:SL,XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH
參考文獻(略)。
政策論壇可供全球衛生政策制定者討論挑戰和機遇以改善其社會衛生保健。
引用格式:Lewin S, Bosch-Capblanch X, Oliver S, Akl EA, Vist GE等(2012)Guidance for Evidence-Informed Policies about Health Systems: Assessing How Much Confidence to Place in the Research Evidence. PLoS Med 9(3): e1001187. doi:10.1371/journal.pmed.1001187。
發表時間:2012年3月20日。
版權所有:基于知識共享署名協議的條款,本文可開放獲取,只要原作者和資料來源可信,本文可無限制使用、在任何媒體中發布和再版(2012年Lewin等)。
資助:手冊的制定受洛克菲勒基金會和WHO資助,基金會沒有參與研究設計、數據收集與分析、發表決定或文稿準備工作。本文代表作者觀點,而非WHO或洛克菲勒基金會。
利益沖突:WHO基金資助了瑞士熱帶與公共衛生研究所和挪威衛生服務知識中心,用于DD、PS、LB、SL和XBC制定衛生系統指導手冊,部分工作已在本文中報告。DG是《PLoS Medicine》編輯委員會成員,EAA和GEV是GRADE工作組成員,其余作者均聲明沒有利益沖突。
縮寫:GRADE,推薦等級的評估、制訂與評價;WHO,世界衛生組織。
*郵箱:simon.lewin@nokc.no。
出處:非約稿,進行了同行評審。
王小琴1, 2 ??王琪1, 2,譯?陳耀龍1, 2??楊克虎1, 2,審校
1.蘭州大學循證醫學中心/中國GRADE中心,蘭州大學基礎醫學院(蘭州730000)
2.甘肅省循證醫學與臨床轉化重點實驗室(蘭州730000)
收稿日期:2014-03-25修回日期:2014-05-28
本文編輯:張永剛、杜亮
1 引言
衛生系統包括以促進、恢復或保持健康為目的的所有組織和個體,以及各種行動方案,見本文術語定義(框S1)。衛生系統干預則確定或改善衛生系統中的行政(如專業人員許可)、財政(如醫療保險機制)和供給(如保健提供者)管理,以及實施戰略(如改變衛生保健提供者行為的策略)。這些干預的重點在于憑借自身實力加強衛生系統,或為需求者提供符合成本效果的項目與技術(如藥物和疫苗)。衛生系統加強的決策(包括由政策制定者制定的推薦意見)需要干預效果的證據和多種其他證據。比如在評估可能的政策方案時,經濟學評價和對利益相關者觀點的定性研究的再評價就很重要(表S1),因為此類證據有助于分析以上方案的成本效果,并確定利益相關者所認可的方案。
框1 “評估對指導加強衛生系統決策的證據的
·?此類證據用戶在對證據的信心上,幾乎總是得出明確或不明確的結論。 ·?此類證據會有助于形成推薦意見,包括推薦強度。 ·?系統明確的方法有助于: ·?促進證據的嚴格評價 ·?避免偏倚 ·?明確實施問題 ·?解決利益相關者的分歧 ·?呈現關于證據和決策形成的信息,以及基于這些信息的推薦 ·?系統透明的方法對多種衛生系統干預的復雜性尤為重要。這些干預在以下方面可能比較復雜:離散但有效的組分的數量及其相互作用;干預針對的行為數量;干預針對的組織層面的數量;干預實施的靈活度與適合度;干預實施所需的技能水平;環境依賴程度[48, 49]。鑒于這些干預的復雜性,基于證據的背景相關性做出決定至關重要。 *來源:改編自[30]。
對衛生系統干預的各種現有證據的信心評估,是決定將其用于加強衛生系統的關鍵部分(框1)。作為衛生系統指導三篇系列文章[1, 2]的第三篇,本文旨在:
·?闡明目前可用于評價支持政策制定過程各個環節的不同類型證據的工具;
·?討論GRADE(推薦等級的評估、制訂與評價)用于評估對效果估計(即“證據質量”)的信心,并對衛生系統干預政策方案的推薦強度進行分級;
·?討論制定衛生系統干預政策方案的推薦意見時的重要因素。
本系列第一篇文章[1]舉例說明了通過制定指導以促進衛生系統問題決策的形成,并探究了其中的具體挑戰和可能的解決方案。第二篇文章[2]則從全球和國家兩個層面研究了指導制定與政策制定的聯系,以及政策制定影響因素的范圍。
這3篇文章都基于衛生系統指導制定工作組的討論(框2 [1, 2])。本文重點關注了GRADE方法,可對證據質量和推薦意見強度進行透明系統的分級[3]。
框?2?衛生系統指導制定工作組
·?WHO于2009年成立了衛生系統指導制定工作組,旨在改善對衛生系統指導需求的響應情況。 ·?工作組由20名成員組成,由WHO根據其在衛生系統研究及實施領域的專業遴選出。 ·?工作組通過大量面對面會議和虛擬會議,幫助和監督制定《衛生系統指導制定手冊》,并確定需要深入交流和討論的更多問題[39]。 ·?工作組建議對部分方法和工具進行調整用于衛生系統指導的制定,同時闡明這些方法在哪些方面存在重大差異。 ·?本文編寫組進一步考慮了討論中提出的問題,完成初稿并提交至工作組進行評審。 ·?經過工作組和外審人員的幾番評審,本文和本系列的其他兩篇文章[1, 2]最終定稿。
2 評價支持加強衛生系統的政策制定過程中所需證據的工具
高質量的系統評價[4]可用于獲取最佳可得證據,從而判斷各種政策方案的效果,并促進政策制定過程的其他重要步驟(表S1)。正如本系列第二篇文章所述[2],用戶需要具備一定的能力來評價與政策制定每個步驟相關的系統評價中的證據。例如,在定義問題及干預需求時,需要借助工具評估對“關注概念化問題不同方法的研究綜述”(如人們對問題的經驗的研究綜述)證據的信心[5];評估可能的政策方案時,需要工具評估對如“評價影響的研究(如對效果研究的系統評價)”的信心;在確定實施注意事項時,也需要工具來評估對“實施影響因素的系統評價”的信心。
現在,許多工具都可用于評估干預效果的單個研究的偏倚風險[6]和評價單個定性研究[7],也有工具可用于評價系統評價中證據的質量[6]。這些納入證據的質量還需得出有意義的結論。對評估對系統評價中證據的信心程度,需要與系統評價的質量(即可靠性)區別開來。我們已制定了評價系統評價和Meta分析的報告工具(如PRISMA清單[8])及其方法學質量或可靠性的工具(如SUPPORT工具[9]和AMSTAR [10])(表 1),而我們重點關注的工具則是那些用于評估系統評價結果信心的工具。

2.1 評估對政策方案效果的系統評價結果的信心
評估對系統評價結果信心的工具大多適用于效果證據的系統評價。GRADE方法就是其中之一,此外還有許多其他工具[11]。在GRADE方法中,系統評價的證據質量受納入研究的質量及許多其他因素影響(表S2)。GRADE方法有很多優勢(表S3),也為越來越多的國際組織所應用,包括世界衛生組織(WHO)、Cochrane協作網,以及多個指南制定機構[3](另見于http://www.gradeworkinggroup.org)。接下來,我們將討論GRADE方法在評價衛生系統干預的證據質量和推薦強度中的應用。
2.2 評估對問題(非效果)系統評價結果的信心
幫助評估對與政策制定過程相關的問題(非效果)的信心的工具正處于早期制定階段。此類問題包括利益相關者的價值觀和意愿,以及干預的可行性(表S1);而對其中的部分問題,定性研究的系統評價和地方證據可共同支持評估結果[12]。若系統評價是通過定性的方法理解問題本質,質量評價就是評價在不同背景下結果解釋的一致性。盡管單個定性研究的質量標準一般都會考慮每個研究的方法及其結果的可信度與詳細程度[7, 13, 14],但迄今為止對定性研究系統評價的質量評估工具卻并未考慮研究結果的可信度與詳細程度,表S4中則提出了可實現這一點的工具。
探究影響方案實施的因素的系統評價能會使用混合法綜合(即定性與定量證據的綜合),如研究現有計劃或政策中隱含的解釋性理論的現實主義綜合[15],或提供高度結構化的演繹法對已有模型或框架進行數據分析的框架綜合(如[16-18])。而質量評價的重點則在于對單個研究各結論的信心[19]。將證據作為一個整體進行分級,可將影響每個結論的研究數量和背景,以及得出結論的方法的恰當性(見文獻插圖[16])考慮在內。單個研究可能會支持某一理論或與之相悖,而多個研究則可共同加強這一理論。關于混合法系統評價綜合研究得出政策方案的利弊結論,至今尚無任何可用于評價其效果的工具。
另一重要問題是資源利用。現已有工具可用于評估經濟學研究系統評價的可靠性[20]。此外,GRADE方法提供了關于“如何將對資源利用的考慮整合到推薦中”的指導[21]。
3 GRADE方法用于評估對衛生系統干預效果估計的信心
GRADE方法明確地區分了兩個問題,即證據質量和推薦強度。而證據質量只是評價推薦強度時的多個考慮因素之一。
在系統評價中,GRADE將證據質量定義為對效果估計的信心;而在指南或指導中,GRADE將其定義為對支持某具體推薦意見的效果估計的信心;信心程度是連續變量,但在實際應用中,我們將其分為高、中、低、極低四個等級(表S5)。
衛生系統干預效果的證據帶來了很多挑戰,這反過來影響使用GRADE方法評價證據質量和形成推薦意見。第一,盡管試驗性研究(包括實用隨機試驗[22])可用于部分衛生系統干預,但對于其他干預措施(特別是關于行政和財政管理的干預),其證據可能主要源于觀察性研究,包括國家級或州級項目的評估[23, 24]。第二,衛生系統干預評估常使用整群設計,而這些研究設計的實施、分析及報告質量常常較差[25, 26]。第三,衛生系統干預傾向于測量替代結局,如服務或激勵措施的應用情況,證據用戶需要判斷是否有充分證據說明替代結局與期望的健康結局之間的關系。而制定結局框架來幫助評價干預(舉例見[27, 28])可有助于制定者判斷替代結局是否充分。最后,未能充分描述對衛生系統和政策系統因素以及實施注意事項時,可能難以做出符合背景的政策方案的推薦意見[29]。GRADE則致力于系統透明地對這些問題進行判斷。
4 形成衛生系統干預備選政策方案的推薦意見
從證據到備選方案推薦意見,需要解釋多種因素,而不僅僅是證據。多數情況下,我們需要評估這些因素的解釋,這突出了透明的重要性,特別是在推薦意見需要考慮多種復雜衛生系統干預時(且每種干預都有其相應的證據質量評價)。另一個挑戰是評估大量的衛生系統和政策系統因素——影響不同環境下對某一衛生系統問題的各種方案的選擇和實施(見本系列其他文章[1, 2])——所要面臨的其他復雜性。例如,一個衛生系統問題可能涉及很多利益相關者,而他們對現有方案卻各持己見;此外,衛生系統干預在不同環境下也可會有不同的系統效果。因此,相比臨床指南制定單一的推薦意見,衛生系統指導從證據出發,并列出大量適用于不同環境的方案,用于解決某個衛生系統問題可能更為有效。而這些方案反過來又可能需要在國家或次國家層面上得到協商或決策制定,詳見后文討論部分或本系列其他文章[2]。
GRADE等的工具有助于對方案的推薦強度進行分級[30, 31],也可用于衛生系統干預,但需明確納入其他影響因素(框3)才能發揮作用。探索這些因素的實用性需要進一步研究,但一般來說,任何指導推薦意見制定的工具都應通過清晰描述并解釋其影響因素來提高透明性,以促進推薦意見的形成。
框?3?影響決定政策方案推薦強度的可能因素
GRADE因素(改編自文獻[30]): ·?利弊平衡是否具有不確定性; ·?系統評價證據的質量(極低、低、中、高); ·?利益相關者的價值觀和意愿是否具有不確定性或差異性; ·?不確定成本或資源利用是否取得了應有的凈收益; ·?干預可行性(或影響證據轉化為實踐的地方因素,包括公平性問題)是否具有不確定性。 ? 可能有助于衛生系統干預考慮的其他因素: ·?在系統層面促進實施,包括行政管理(如規范的改變)、財政管理(如具體環境中方案與籌資模式的契合度)、實施策略(如向實施者或輔助者提供所需技能與經驗的方式)。 ·?社會政治注意事項(如聯系推薦方案與現有政策的方式),政策系統的價值標準(關于公平性或私有化等問題)以及經濟改革。
在GRADE方法中,推薦意見反映了對推薦方案應用效果利大于弊的信心程度。具體來說就是強推薦表示推薦意見的應用效果利大于弊,而有條件(或“有限制的”、“弱”)推薦則表示該推薦意見的應用效果可能利大于弊,具有不確定性。
GRADE試圖根據推薦意見所考慮的因素做出透明(通過文件記錄)和系統(對指南考慮的所有問題使用同一方法)的判斷。表 2、表S6、表S7說明了GRADE方法在衛生系統干預中的應用(分別包括供給管理、財政管理以及實施策略),并呈現了衛生系統干預指導如何描述多種適用于不同環境的政策方案(該方法有待于進一步研究)。和其他分級系統一樣,GRADE也沒有提供有關對證據“可接受性”或“可行性”信心程度評估的指導。按照慣例,這些決定都是通過指南小組共識得出的,小組需要包括具備指南問題相關的專業知識和經驗的個人。還需要進一步工作來制定此類證據質量評價的正式方法。

4.1 從評價證據質量到形成政策方案推薦的挑戰
從評價證據質量到形成政策方案的推薦意見會面臨很多挑戰。首先,評估推薦強度可能需要詳細了解證據的產生和評價過程,但這一過程并非總是可得。第二,將推薦意見分為“強”和“弱”兩級存在困難,比如制定全球指導的小組可能不愿做出“弱”推薦,因為政策制定者認為“弱推薦”就等于“沒有推薦”,故不會對此類推薦意見做出回應。第三,我們常用GRADE等工具評價兩種備選政策方案的證據質量,而很多衛生系統評價(實際上還有很多臨床決策)則包含多重干預,這增加了解釋和決策制定的復雜程度,使得透明性顯得更加重要。
如何應對這些挑戰呢?在制定并解釋系統評價以及應用GRADE等工具進行評估時需要方法學專業知識,因此衛生系統指導小組需要方法學家的支持。此外,還應將這些工具的輸出結果“轉化”成適當的語言及格式,以確保指導小組能夠正確理解并應用其結果。相關研究正在各類計劃中開展,如DECIDE(制定并評估交流策略以支持知證決策和循證實踐;http://www.decide-collaboration.eu)協作網就是關于向政策制定者呈現GRADE評價與政策方案信息的方法。
4.2 其他挑戰
在制定衛生系統干預政策方案的推薦意見時,還面臨著很多其他挑戰。首先是用于評價證據質量和形成推薦意見的工具需要能夠適用于各種評價衛生系統干預效果的研究類型,而GRADE就有可能實現這一點。其次,形成衛生系統干預的推薦意見,需制定出對其他類型證據(如關于可接受性的證據)的信心評估的工具[32]。
最后,國際標準制定組織(如WHO)必須做出適用于全球的推薦意見。但正如之前提到的,制定衛生系統問題的全球推薦并非易事,因為具體環境因素的重大變化會影響國家和次國家層面干預的適用性[2, 33]。我們在本系列第二篇中已提出了一種有助于聯系全球指導制定和國家政策制定的方法[2]。
當有必要在全球水平制定推薦意見時,那些正在制定的指導可能需要列出各種政策方案而非單個推薦意見。此類方案可能包括一個或多個問題,也可能基于與這些問題相關的系列干預。衛生與政策系統因素在與具體方案聯系起來時而被納入考慮,例如:這些方案可能會基于不同環境下開展的評估來描述干預內容及實施方法的變化。需要進一步來探究政策制定者如何理解并選擇全球指導中的政策方案。但向國家決策者提供工具來幫助他們做出適合于其所在環境的推薦意見才可能有效,而目前已有[33, 34]或正在制定多個這樣的工具(見http://www.decidecollaboration.eu/work-packages-strategies)。重要的是,在評價干預、背景和其他情況變化的影響時,全球指導應明確所需考慮的因素,而決策模型在探究這些變化的效果時可能有效(如[35, 36])。由于衛生系統問題的政策方案常只有低質量證據,因此很多情況下可能還需要評估推薦方案。
4.3 向指導小組和政策制定者呈現背景與實施問題的證據
提供衛生系統和政策系統相關的背景與實施問題的證據,可幫助指導小組和政策制定者判斷推薦強度,但目前最佳提供方式尚不明確。針對政策制定者的證據總結和效果系統評價結果總結表(Summary of findings,SOF)等相關研究指出,在制定有效且可理解的呈現方法時,其形式和內容同樣重要[37, 38]。《衛生系統指導制定手冊》提出了一種以用戶友好的證據文件形式向利益相關者呈現此類證據的方法[39];同樣,本系列文二中描述了更多的衛生與政策系統特點,我們可能需要對其進行評價以形成決策[2]。
若想要讓指導小組和政策制定者能夠使用證據來判斷推薦方案的強度,那么還需要更多的研究和試驗方法(包括可視化形式)呈現可得的證據,也要努力加強政策制定者使用證據進行決策的能力[2, 12, 40]。
5 結論
目前已有不少的工具可對衛生系統政策方案的證據質量和推薦強度進行分級,但仍有不少問題需要解決。首先,需要應用這些工具進行系統透明的判斷。第二,對很多衛生系統問題,證據質量可能較低。但這些領域需要更高質量的研究才能增加指導小組對證據的信心,以做出更強的推薦意見。第三,需要研究方法來制定、構建以及呈現全球衛生系統指導的備選政策方案。這些方案要包括衛生與政策系統因素和實施注意事項的證據,還要完善相應的證據評價工具。最后,需要更加關注如何將衛生系統干預指導應用到地方水平。
相關資料
其他語言的要點概述S1:西班牙語版要點概述(Xavier Bosch-Capblanch譯)(DOC)
其他語言的要點概述S2:法語版要點概述(Bruno Clary, William Lenoir, Lise Beck譯)(DOC)
其他語言的要點概述S3:葡萄牙語版要點概述(Bruno Viana譯)(DOC)
其他語言的要點概述S4:阿拉伯語版要點概述(Fadi El-Jardali譯)(DOC)
框S1:本文術語定義(PDF)
表S1:政策制定過程不同階段所需的系統評價類型,以及對這些系統評價證據進行信心評估的工具的可得性(PDF)
表S2:GRADE標準:評價效果系統評價中的每個重要結局的證據質量(PDF)
表S3:GRADE方法的優勢(PDF)
表S4:評估對定性研究系統評價結果的信心(PDF)
表S5:GRADE中證據質量分類的定義(PDF)
表S6:影響推薦意見強度決策的因素:以中低收入國家用戶費用的變化為例(PDF)
表S7:影響推薦強度決策的因素:以挽留鄉村衛生工作者的繼續教育項目為例(PDF)
致謝
我們對衛生系統指導制定工作組的其他成員(以及工作組成立時他們的工作單位)表示由衷的感謝,包括:Edgardo Abalos,羅薩里奧圍產期研究中心(阿根廷);Abdul Ghaffar,WHO衛生政策與體系研究聯盟(瑞士);Timothy Evans,WHO信息、證據及研究部門助理總干事(瑞士);Regina Kulier,WHO研究政策與合作司信息、證據及研究部門(瑞士);Pierre Ongolo Zogo,最佳衛生實踐制定中心,雅溫德中心醫院,雅溫德大學,雅溫德(喀麥隆);Tikki Pang,WHO研究政策與合作司信息、證據及研究部門(瑞士);Ulysses Panisset,WHO研究政策與合作司信息、證據及研究部門(瑞士)。
同時要感謝以下人員的用心付出:Claire Glenton和Andy Oxman,挪威衛生服務知識中心(挪威)。
作者貢獻
構思和設計試驗:SL,XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH;撰寫初稿:SL;參與文章撰寫:XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH;閱讀并滿足國際醫學雜志編輯委員會(ICMJE)著作權標準:SL,XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH;認同文章結果和結論:SL,XBC,SO,EAA,GEV,JL,DG,JAR,PS,MG,PT,FEJ,AH
參考文獻(略)。
政策論壇可供全球衛生政策制定者討論挑戰和機遇以改善其社會衛生保健。
引用格式:Lewin S, Bosch-Capblanch X, Oliver S, Akl EA, Vist GE等(2012)Guidance for Evidence-Informed Policies about Health Systems: Assessing How Much Confidence to Place in the Research Evidence. PLoS Med 9(3): e1001187. doi:10.1371/journal.pmed.1001187。
發表時間:2012年3月20日。
版權所有:基于知識共享署名協議的條款,本文可開放獲取,只要原作者和資料來源可信,本文可無限制使用、在任何媒體中發布和再版(2012年Lewin等)。
資助:手冊的制定受洛克菲勒基金會和WHO資助,基金會沒有參與研究設計、數據收集與分析、發表決定或文稿準備工作。本文代表作者觀點,而非WHO或洛克菲勒基金會。
利益沖突:WHO基金資助了瑞士熱帶與公共衛生研究所和挪威衛生服務知識中心,用于DD、PS、LB、SL和XBC制定衛生系統指導手冊,部分工作已在本文中報告。DG是《PLoS Medicine》編輯委員會成員,EAA和GEV是GRADE工作組成員,其余作者均聲明沒有利益沖突。
縮寫:GRADE,推薦等級的評估、制訂與評價;WHO,世界衛生組織。
*郵箱:simon.lewin@nokc.no。
出處:非約稿,進行了同行評審。
王小琴1, 2 ??王琪1, 2,譯?陳耀龍1, 2??楊克虎1, 2,審校
1.蘭州大學循證醫學中心/中國GRADE中心,蘭州大學基礎醫學院(蘭州730000)
2.甘肅省循證醫學與臨床轉化重點實驗室(蘭州730000)
收稿日期:2014-03-25修回日期:2014-05-28
本文編輯:張永剛、杜亮